Добавить новость

Глава МИД Франции Барро счел немыслимым возвращение России в Большую семерку

Песков: подготовка встречи Путина и Трампа требует особых усилий

В Красногорске завершился первый день финального этапа чемпионата России по гонкам на льду

В РФ в перечень террористических внесли 174 организации





Новости сегодня

Новости от TheMoneytizer

Российские ученые создали платформу для контекстного обучения с подкреплением  

Исследователи Университета Иннополис, T-Bank AI Research и AIRI разработали XLand-MiniGrid — открытую виртуальную среду для исследований в области контекстного обучения с подкреплением (In-Context RL). Это направление искусственного интеллекта помогает моделям быстрее адаптироваться к новым задачам, используя подсказки и контекст вместо длительного обучения с нуля. Платформа уже заинтересовала ведущие научные центры, включая Google DeepMind и Оксфордский университет.  

Почему это важно?

Контекстное обучение с подкреплением позволяет искусственному интеллекту быстро реагировать на новые условия и дообучаться в процессе работы. Это особенно полезно для персонализированных рекомендаций, управления роботами и автономных транспортных систем. Однако доступные платформы для таких исследований ограничены. Корпоративные среды, например Google DeepMind, закрыты, а публичные инструменты не подходят для сложных задач.  

XLand-MiniGrid устраняет эти барьеры. Она позволяет моделировать задачи разной сложности, менять условия в реальном времени и использовать готовые датасеты, что упрощает разработку новых алгоритмов.  

Технические особенности

Среду построили на базе JAX — технологии, способной выполнять миллиарды операций в секунду. За счет высокой производительности XLand-MiniGrid собрала более 100 миллиардов примеров поведения ИИ, охватывающих 30 тысяч различных задач. Это позволяет исключить этапы начального обучения, оптимизируя ресурсы и время исследований.  

На графике показано, что XLand-MiniGrid позволяет агентам совершать до 1 трлн взаимодействий со средой за три дня, что ускоряет эксперименты и проверку гипотез. Однако больше половины попыток обучения агентов заканчиваются неудачей. Несмотря на повышение среднего качества агентов, медианное значение остается на нуле, что подчеркивает высокую сложность самой среды для текущего уровня технологий, а значит, может стимулировать их улучшение

Мнение разработчиков

«Когда мы начали работать в этой области, ни одна существующая платформа не подходила для тестирования наших идей. Это стало серьезной проблемой не только для нас, но и для других исследователей. XLand-MiniGrid появился, чтобы закрыть этот пробел», — пояснил Вячеслав Синий из T-Bank AI Research.  

Руководитель группы «Адаптивные агенты» Владислав Куренков добавил, что благодаря разнообразию задач в XLand-MiniGrid можно собирать обширные датасеты и обучать алгоритмы без необходимости начинать с нуля.  

Эксперименты в XLand-MiniGrid уже провели исследователи из Google DeepMind, Калифорнийского университета в Беркли и Оксфордского университета. Научная статья XLand-MiniGrid: Scalable Meta-Reinforcement Learning Environments in JAX, описывающая создание среды, была принята на крупнейшую международную конференцию в области искусственного интеллекта — NeurIPS 2024. В этом году конференция пройдет с 10 по 15 декабря в Ванкувере, Канада.

Читать далее:

Сверхзвуковой самолет побил рекорд: всего 3,5 часа полета из Лондона в Нью-Йорк

Анализ 11 млрд лет эволюции Вселенной подтвердил, что Эйнштейн был прав

Ученые нашли новый идеал женской фигуры: дело не в 90-60-90

Обложка: AI | freepik

The post Российские ученые создали платформу для контекстного обучения с подкреплением   appeared first on Хайтек.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Вице-премьер Голикова: в РФ предстоит заместить больше 10 миллионов работников

В 2024 г. Россия сохранила лидерство по поставкам нефти в Чехию

Организаторы Blockchain Life 2025 в Москве анонсировали вторую сцену с интерактивной программой

Единое хранилище чеков создали в России. Плюсы и минусы нового сервиса

Музыкальные новости

Онлайн-кинотеатр PREMIER выставил на продажу на Авито вещи Рузиля Минекаева и Полины Гухман со съемок сериалов

В Тамбовской области завершился турнир по хоккею на Кубок генерала армии Николая Рогожкина

В Екатеринбурге наградили юных звезд на благотворительном фестивале «Добрая волна»

Состоялась окружная конференция СРО НОПРИЗ, зарегистрированных на территории Дальневосточного федерального округа

Новости России

СМИ выяснили, что произошло в петербургском автобусе, из которого валил дым

На рынок выходит первый отечественный препарат для похудения «Тирзетта»

В ярославской ГАИ назвали сроки установки комплексов автофиксации нарушений ПДД

Воробьев: почти 70 медиков нашли работу по программе «Приведи друга» в 2025 году

Экология в России и мире

Владимир Кузьмин поздравит женщин с 8 марта большим весенним концертом

Не покупайте такие сувениры: туристам угрожают тюрьмой за некоторые покупки на популярном тропическом курорте

Сотрудники сервисного локомотивного депо «Сольвычегодск» филиала «Северный» ООО «ЛокоТех-Сервис» организовали благотворительную акцию

«Нулевые»: DONI, Ганвест и DJ Daveed представили трек с легкой ностальгией по 2000-м

Спорт в России и мире

Медведев обошел Джоковича в рейтинге ATP и стал шестой ракеткой мира

Неожиданный вылет Медведева, США обыграли Канаду на турнире НХЛ. Главное к утру

Паула Бадоса разгромила Мертенс во втором круге турнира WTA-1000 в Дубае

“Курникова в инвалидном кресле больше не нужна?”, – поклонники Иглесиаса нашли ему новую пассию

Moscow.media

Таинство первого снега (продолжение)

Беспроводной сканер штрих-кодов SAOTRON P05i промышленного класса

Свердловская область вновь не вошла в топ-10 регионов по качеству жизни

В Орловской области возбуждено уголовное дело по факту невыплаты заработной платы











Топ новостей на этот час

Rss.plus






Воробьев: почти 70 медиков нашли работу по программе «Приведи друга» в 2025 году

Переговоры РФ и США в Эр-Рияде продолжались 4,5 часа

В ярославской ГАИ назвали сроки установки комплексов автофиксации нарушений ПДД

Единое хранилище чеков создали в России. Плюсы и минусы нового сервиса