Добавить новость

Камила Валиева поступила в институт

Софья Аржаных заведет блог о свиданиях

Токсиколог Кутушов назвал методы профилактики заболеваний у школьников

Эксперимент по партионному учету маркированной молочной продукции пройдет в России



Новости сегодня

Новости от TheMoneytizer

В настоящее время проводятся новые исследования, посвященные проблемам и возможностям масштабирования систем машинного обучения, питающих модели ИИ, и их результаты довольно плачевны

Проводятся новые исследования проблем и возможностей масштабирования систем машинного обучения, лежащих в основе моделей искусственного интеллекта, но результаты довольно мрачные. Эксперты говорят, что у таких компаний, занимающихся искусственным интеллектом, как OpenAI, заканчиваются мировые (искусственные) данные для обучения текста. Модели, более продвинутые, чем нынешние, такие как GPT-5 или GPT-6, могут даже исчерпать доступные источники данных к 2026 году. Возникает вопрос: сможет ли ИИ продолжать развиваться без новых человеческих текстовых данных?

Последние достижения в области языкового моделирования в значительной степени зависят от больших объемов текста, написанного людьми, часто полученного из Интернета или архивов компаний. Фактически общедоступные текстовые базы данных содержат миллиарды слов с миллиардов веб-страниц. Тем не менее, недавние исследования показывают, что компании, занимающиеся искусственным интеллектом, сталкиваются с серьезной проблемой: истощением данных. Столкнувшись с потенциальными препятствиями на пути масштабирования больших языковых моделей (LLM), исследователь искусственного интеллекта Тамай Бесироглу сказал Associated Press: «Здесь есть серьезные узкие места".

«Если вы столкнетесь с ограничениями данных, вы не сможете эффективно расширить модель.

Обратите внимание: Учёные разработали революционную технологию для исследования египетских мумий.

А расширение модели, вероятно, является наиболее важным способом расширить возможности модели и улучшить качество результатов», — добавил он. Инструменты искусственного интеллекта также без разбора используют публичные онлайн-архивы, и это противоречивая тенденция в использовании данных, которая вызвала судебные иски. Так произошло, например, с издателем New York Times, который подал в суд на OpenAI за нарушение авторских прав.

К головокружительному снижению потока нового контента

Исследователи говорят, что если нынешние тенденции в развитии LLM сохранятся, модель сможет работать с набором данных размером примерно с все общедоступные текстовые данные в период с 2026 по 2032 год (или даже раньше, если модель будет переобучена) обучение. Кроме того, исследователи из аналитического центра Epoch AI в Сан-Франциско отметили в отчете, что объем текстовых данных, используемых только для обучения моделей ИИ, увеличивается примерно в 2,5 раза каждый год. Они также полагают, что крупные языковые модели, такие как GPT-4 от OpenAI и Llama 3 от Meta (которая считается экстремистской группировкой в ​​России и чья деятельность запрещена), могут выйти из строя в 2026 году.

Чтобы устранить это препятствие, другие исследователи изучают, как продолжить разработку языковых моделей после того, как наборы данных сгенерированного человеком текста будут исчерпаны. Они утверждают, что наиболее возможным решением является обучение языковых моделей на синтетических (сгенерированных) данных, что предполагает перенос обучения из областей, богатых данными. OpenAI, Google и Anthropic уже работают над этим решением.

Однако, согласно выводам ученых из Университета Райса и Стэнфордского университета, использование в этих моделях контента, созданного ИИ, приводит к значительному снижению качества генерируемого контента. Это может создать цикл самообмана и вызвать множество вопросов: смогут ли алгоритмы ИИ стать более эффективными, производя лучшие результаты с меньшим количеством данных.

«Я думаю, важно помнить, что нам не обязательно обучать все более и более крупные модели», — сказал Николас Паперно, исследователь искусственного интеллекта и доцент кафедры компьютерной инженерии в Университете Торонто. Тем не менее, результаты этого исследования подчеркивают важность продолжения исследований для измерения темпов роста эффективности данных, а также потенциальных улучшений, приносимых новыми методами.

Больше интересных статей здесь: Новости науки и техники.

Источник статьи: В настоящее время проводятся новые исследования, посвященные проблемам и возможностям масштабирования систем машинного обучения, питающих модели ИИ, и их результаты довольно плачевны.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Камила Валиева поступила в институт

Департамент ГОЧС и ПБ: последствия ДТП в Новой Москве ликвидировали

В Москве прошла самая масштабная свадьба страны

Россиянка потеряла платья почти на миллион рублей

Музыкальные новости

Сотрудники Росгвардии организовали экскурсию для детей в музей современной истории

Побороться за участие в Чемпионате мира могут амурские футболисты

Собянин: в Подмосковье сбиты девять беспилотников

«Спартак» — «Автомобилист» — 4:3 Б. Видеообзор матча Кубка мэра Москвы

Новости России

Департамент ГОЧС и ПБ: последствия ДТП в Новой Москве ликвидировали

Владимирская филармония приглашает жителей и гостей города на праздник цыганской культуры

Синоптик назвал 1 сентября 2024 года в Москве самым жарким в XXI веке

Россиянка потеряла платья почти на миллион рублей

Экология в России и мире

Мегадискотека Детского радио «Дети как звезды!» пройдет 1 сентября в Москве и Санкт-Петербурге

Анекс сделал заявление по Таиланду: теперь рейсы на Пхукет будут выполняться из 14 городов России, а в Паттайю из 4-х

Как при помощи одежды оставаться молодой и привлекательной

Stephane Rolland осень-зима 2024

Спорт в России и мире

Джокович проиграл в третьем круге US Open и впервые с 2017 года закончит год без титула на турнире Большого шлема

Путинцева в матче с пятой ракеткой мира определила участницу 1/8 финала US Open

Зверев выиграл 100-й матч на турнирах «Большого шлема»

Российский теннисист Медведев вышел в третий круг US Open

Moscow.media

Мытищинское предприятие ООО «Водомер» получило Диплом победителя в региональном конкурсе «100 лучших товаров России»

Найдено существо, делающее самое быстро сальто назад

Соцфонд проиндексирует пенсии работающим пенсионерам в феврале

Прогулки над облаками...











Топ новостей на этот час

Rss.plus






Самарские «Крылья Советов» дома уступили махачкалинскому «Динамо»

Камила Валиева поступила в институт

Панда Катюша получила развивающие кубики на День знаний

В Правительство Москвы направлены подписи за модернизацию культурных и социальных объектов САО