Добавить новость

Реконструкция сети газоснабжения проходит на севере Москвы

Штаб Мадуро заявил о его победе на выборах президента Венесуэлы

Панда Катюша в поисках идеального бамбука попала на видео

Июль может закончиться сильной магнитной бурей





Новости сегодня

Новости от TheMoneytizer

Собран набор данных, чтобы учить ИИ самостоятельно принимать решения

Опубликован крупнейший общедоступный набор данных для контекстного обучения с подкреплением, сообщает пресс-служба Института искусственного интеллекта AIRI.

The post Собран набор данных, чтобы учить ИИ самостоятельно принимать решения appeared first on Хайтек.

Исследователи из российского Института искусственного интеллекта AIRI и лаборатории T-Bank AI Research опубликовали два общедоступных набора данных для контекстного обучения с подкреплением на основе среды XLand-MiniGrid. Упрощенная версия содержит чуть меньше 20 млрд кортежей — упорядоченных наборов данных фиксированной длины, полная — свыше 112 млрд.

Наборы данных валидировали с помощью графиков обучающих историй — траектории были естественным образом упорядочены по возрастанию суммарной награды за эпизод, сообщают разработчики. Они считают, что наборы помогут настраивать ИИ-системы для решения новых задач без вовлечения узкопрофильных специалистов, а также станут источником полезных синтетических данных.

Контекстное обучение с подкреплением (In-Context Reinforcement Learning) сфокусировано на создании моделей, которые хорошо работают не только на тренировочных задачах, но и способны максимально эффективно дообучаться за минимальное время. Например, большинство чат-ботов можно научить новой задаче, добавив в промпт некоторое количество примеров ее решения.

Такие методы подходят, чтобы обучать ИИ принимать решения, объясняют разработчики. ИИ-агент должен исследовать среду (exploration) и понять, какие действия ведут к хорошему исходу, а какие — к плохому. Затем он должен остановиться и перейти в фазу «эксплуатации хороших действий» (exploitation). Задача exploration — exploitation заключается в том, чтобы найти механизм обучения, который на горизонте N шагов обеспечивает наилучший результат за меньшее количество шагов.

В области контекстного обучения с подкреплением нет стандартизации, и авторы всех ранее существующих работ были вынуждены каждый раз собирать новый датасет с нуля, добавляют разработчики. Они полагают, что опубликованные наборы данных помогут демократизировать исследования, ускорят развитие этого направления обучения и масштабирование технологий.


Читать далее:

Посмотрите, как выглядит полярное сияние из космоса

Случайность спасла Землю от мощнейшей солнечной вспышки

Пациенту впервые пересадили титановое сердце на магнитной подвеске

На обложке: Изображение от freepik, сведения о лицензии

The post Собран набор данных, чтобы учить ИИ самостоятельно принимать решения appeared first on Хайтек.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Подрядчик из Москвы восстановит горевший дом по ул. Войкова в Томске

Следком завел уголовное дело о халатности после жалоб на мигрантов в Одинцово

Финал чемпионата России по эндуро прошел в Зарайске

Пенсионеров Красноярского края приглашают поделиться интернет-достижениями

Музыкальные новости

Визит Лукашенко в Москву завершился. Подробностей переговоров все еще нет

Состав тамбовского ФК "Спартак" пополнил новый нападающий

Собянин: В Москву привезли свыше 500 тыс. растений на фестиваль «Лето в Москве. Сады и цветы»

Сбежавшего из Израиля в РФ подростка-вундеркинда нашли в отеле рядом со Внуково

Новости России

Навстречу совершенству: «Лайф Строй» – эксперт в искусстве создания идеального дома

Самарская область попала в рейтинг регионов России по перспективности трудоустройства

Ефимов: Город предоставил инвестору участок для строительства производственного комплекса в Очаково-Матвеевском

Новый детский сад откроют в ЖК «Измайловский лес» в Балашихе к 1 сентября

Экология в России и мире

Elie Saab haute couture осень-зима 2024

«Душевная» гастрономия от Waldorf Astoria Seychelles Platte Island

Советская Москва в 1967 году

ENERGY приглашает на «Пикник Афиши»

Спорт в России и мире

Россиянка Мирра Андреева завоевала первый титул WTA в карьере

Медведев и Андреева сыграли микст на Олимпиаде-2024 в Париже

Теннисистка Веснина показала свою форму на Олимпийские игры в Париже

Олимпийка с титулом // Теннисистка Мирра Андреева перед стартом Игр в Париже впервые выиграла турнир WTA

Moscow.media

Портативный ТСД корпоративного класса Saotron RT-T70

Обложка песни. Обложки альбомов песен. Сделать обложку для песни.

Продолжается реконструкция автодороги Тогот – Курма в Иркутской области

Гора Нос











Топ новостей на этот час

Rss.plus






На Урале мальчик пропал после шутки пьяной бабушки о том, что он приемный

Новый детский сад откроют в ЖК «Измайловский лес» в Балашихе к 1 сентября

Финал чемпионата России по эндуро прошел в Зарайске

Трамп обвинил ОПЕК в попытке снизить цены на нефть для победы Харрис на выборах