Добавить новость

Бастрыкин взял на контроль дело об аварийном общежитии в Больших Вяземах

Жителей города предупредили об изменениях в расписании поездов Ленинградского направления

Ступинцы в День города передавали гумпомощь для жителей приграничья

Жаркая погода сохранится в Москве 1 сентября





Новости сегодня

Новости от TheMoneytizer

[Прожо́ра] "И це́лого ми́ра ма́ло". OpenAI не хватает качественных знаний всего интернета для обучения GPT-5: есть вероятность, что стремительное развитие нейросетей вскоре затормозиться

Согласно отчёту The Wall Street Journal, компаниям вроде OpenAI или Google требуются огромные массивы данных для обучения и совершенствования их больших языковых моделей (LLM), но проблема в том, что в интернете попросту не хватает качественных данных.

Авторы материала на The Wall Street Journal ссылаются на заявления специалиста в области искусственного интеллекта Пабло Вильялобоса из Исследовательского института Epoch. По его словам, языковая модель GPT-4 обучалась на 12 триллионах токенов данных, а если следовать законам масштабирования Шиншиллы, следующая версия требует порядка 60-100 триллионов токенов. Однако в свободном доступе не хватает по меньшей мере от 10 до 20 триллионов токенов подходящего качества текстовых и графических данных. К слову, ещё пару лет назад Вильялобос заявлял, что к середине 2024-го с вероятностью 50% нейросетям перестанет хватать данных для дальнейшего обучения. Тогда он прогнозировал, что к 2026-му такая вероятность будет составлять уже 90%.

В исследовании говорится, что большинство доступных данных в интернете попросту непригодно для обучения ИИ, поскольку содержит бессвязный текст или не содержит новой для нейросетей информации. Усугубляет проблему и тот факт, что крупные платформы, включая новостные агентства и социальные сети, закрывают доступ к своим данным и не дают разрешения компаниям вроде OpenAI на их использование.

По словам главы OpenAI Сэма Альтмана, они разрабатывают новые способы обучения нейросетей. Есть информация, что компания рассматривает возможность создания системы оценки стоимости данных, чтобы платить за них платформам. Согласно отчёту The Wall Street Journal, аналогичный подход рассматривают и в Google. А пока в OpenAI намерены использовать инструмент распознавания речи Whisper, чтобы "вытягивать" сведения из аудиозаписей и видео, находящихся в свободном доступе в интернете.

Внутри компании OpenAI рассматривают ещё один способ обойти нехватку данных - генерацию высококачественных синтетических данных, которые бы использовались для дальнейшего обучения нейросетей.


(https://4pda.to/2024/04/0...)

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

В Москве завершился военно-музыкальный фестиваль «Спасская башня»

Признание силы: Абхазия заявила о намерении вступить в ООН

Архангельские работодатели жалуются на старение населения в регионе

Алтайский край оказался на 72-м месте по уровню предлагаемых педагогам зарплат

Музыкальные новости

Побороться за участие в Чемпионате мира могут амурские футболисты

«Оренбург» — «Динамо» Москва — 2:2. Видеообзор матча РПЛ со спасительным голом на 95-й минуте

Мытищинское предприятие ООО «Водомер» получило Диплом победителя в региональном конкурсе «100 лучших товаров России»

Росгвардейцы обеспечили охрану общественного порядка на Дне города Клин

Новости России

Век живи – век учи: зарплаты алтайских педагогов оказались одними из самых низких в России

«Ъ»: с сентября в регионах РФ начнут массово отключать дорожные камеры

Российский турист прилетел на Кубу и был отправлен назад в Россию по этой причине

Депутат Дюков подал заявления в прокуратуру и ФСБ на красноярскую мэрию из-за срыва дорожного ремонта

Экология в России и мире

Анекс сделал заявление по Таиланду: теперь рейсы на Пхукет будут выполняться из 14 городов России, а в Паттайю из 4-х

«Авторадио» погрузило гостей ММНК в атмосферу знаменитого мюзикла

Токсиколог Кутушов назвал привычку ставить много будильников опасной для здоровья

Ашот Бегларян: Надеюсь, в недалеком будущем великий дух предков возродится в нас

Спорт в России и мире

Шнайдер: чувствую, что США для меня — второй дом

Зверев выиграл 100-й матч на турнирах «Большого шлема»

Теннисист Рублев вышел в четвертый круг Открытого чемпионата США

Американские горки: Рублёв отыгрался со счёта 0:2 по сетам, но всё равно уступил Димитрову в четвёртом круге US Open

Moscow.media

На Кубани, в Тульской и Липецкой областях трассу М-4 Дон готовят к началу учебного года

ТСД промышленного класса Saotron RT-Т510

В жопу Мальдивы!

В России разработали технологию 3D-печати протезов пальцев











Топ новостей на этот час

Rss.plus






Архангельские работодатели жалуются на старение населения в регионе

Драка на летней веранде: стрельба произошла в ресторане в центре Москвы

Депутат Дюков подал заявления в прокуратуру и ФСБ на красноярскую мэрию из-за срыва дорожного ремонта

Алтайский край оказался на 72-м месте по уровню предлагаемых педагогам зарплат