Мы в Telegram
Добавить новость

В папке "Пенсия" лежали 17 млрд рублей: Майор-взяточник переплюнул полковника-миллиардера Захарченко

Головные боли, головокружение, тошнота: опасно ли использовать очки виртуальной реальности

BNA: Путин и король Бахрейна призвали к деэскалации в зоне конфликта Палестины и Израиля

СМИ: Начальника управления ДОГОЗ МО Вертелецкого задержали из-за взятки

Блог сайта «Хайтек+»


Новости сегодня

Новости от TheMoneytizer

ИИ-модель GPT-4 доказала, что тренирует роботов лучше людей

DrEureka — это новый открытый программный пакет, доступный всем желающим. Он позволяет тренировать роботов для выполнения реальных задач с помощью больших языковых моделей вроде GPT-4. Роботы обучаются в виртуальной среде с моделируемой физикой, прежде чем перейти к выполнению действий в реальном мире. Разработчик DrEureka, доктор Джим Фан, привлек внимание к проекту, используя четвероногого робота Unitree Go1 с открытым исходным кодом. «Нам удалось научить робопса балансировать и ходить на мяче для йоги исключительно с помощью обучения в симуляции. При этом не потребовалось никакой дополнительной настройки — робот сразу же справился с задачей в реальном мире», — написал Фан в X.

В симуляции рандомизируются различные параметры, такие как трение, масса, демпфирование, центр тяжести и т.д. Достаточно нескольких подсказок для большой языковой модели вроде ChatGPT, и ИИ сможет написать код, создающий систему вознаграждений/штрафов для обучения робота в виртуальном пространстве, где 0 означает провал, а любое значение выше 0 — успех. Чем выше оценка, тем лучше.

Эта система может создавать параметры, минимизируя и максимизируя точки отказа/сбоя робота в различных областях. Например, подбирает оптимальную упругость мяча, мощность двигателя, степень свободы конечностей и демпфирование. Благодаря своей природе БЯМ способна создавать огромное количество таких вариаций параметров, позволяя системе обучения работать с большим объемом данных. После каждого цикла симуляции ChatGPT анализирует, насколько хорошо справился виртуальный робот, и как его можно улучшить. Превышение или нарушение параметров, например, перегрев двигателя или попытка движения конечностью за пределами ее возможностей, приведет к нулевому результату.

Для того, чтобы заставить большую языковую модель писать обучающий код, требуются инструкции по безопасности. Без них, как обнаружила команда разработчиков, GPT будет стремиться к максимально возможному результату и фактически «обманывать» симуляцию. В симуляции это допустимо, но в реальном мире подобный подход может привести к перегреву двигателей, чрезмерному напряжению конечностей и повреждению робота. Исследователи называют такое поведение «дегенеративным». Так, во время обучения в симуляции робот научился быстрее перемещаться, упираясь бедром в землю и используя три ноги для скольжения по полу, волоча при этом бедро. И хотя подобный способ оказался эффективным в симуляции, попытка повторить его в реальном мире закончилась тем, что робот уткнулся «мордой» в пол.

Поэтому исследователи корректировали инструкции для GPT, подчеркнув необходимость учитывать реальные условия, в которых роботу предстоит работать. В ответ GPT внедрила функции безопасности, следящие за плавностью движений, ориентацией корпуса и его высотой, чтобы предотвратить чрезмерную нагрузку на двигатели робота. Если робот «схитрит» и нарушит эти параметры, его итоговая оценка снизится. Таким образом, функции безопасности помогают предотвращать неестественное и неэффективное поведение.

DrEureka превзошла человека в тренировке робота-пса, добившись повышения скорости движения вперед на 34%. Робот, обученный DrEureka, преодолевал на 20% большее расстояние по смешанным покрытиям в реальных условиях, чем робот, обученный человеком. Исследователи объясняют успех уникальным подходом к обучению. Обычно люди обучают поэтапно, разделяя задачи на мелкие части и объясняя их изолированно. GPT же способна обучать всему сразу, что недоступно человеку. Создатели DrEureka считают, что эффективность обучения возрастет, если предоставить системе GPT обратную связь из реального мира. Сейчас обучение в симуляции основывается исключительно на данных внутренних датчиков робота.

 

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

BNA: Путин и король Бахрейна призвали к деэскалации в зоне конфликта Палестины и Израиля

Стартовал open call V Московской Арт Премии

«Не надо бояться, будет не больно». Захарова удивилась панике США из-за «космического ядерного оружия» Кремля

Индивидуальные тепловые пункты установили в четырех домах в Мытищах

Музыкальные новости

Количество пользователей-инвесторов на платформе «Атомайз» превысило 72000

НАЛОГИ С ЗАРПЛАТ И НДС МОГУТ ОТМЕНИТЬ?! Государственная Дума и Правительство РФ оптимизируют налоги.

Путин поручил утвердить программы развития 10 регионов

Театр имени Бестужева с размахом отметит свой юбилей

Новости России

Конкурс прогнозов F1.D3.RU. Гран При Монако (восьмой этап)

Головные боли, головокружение, тошнота: опасно ли использовать очки виртуальной реальности

СМИ: Начальника управления ДОГОЗ МО Вертелецкого задержали из-за взятки

Стартовал open call V Московской Арт Премии

Экология в России и мире

АО "Желдорреммаш" проводит перезагрузку корпоративного проекта поддержки новаторских инициатив работников компании

Вкусно и безопасно: гастроэнтеролог Садыков назвал 5 продуктов, снижающих холестерин

В Турции для россиян открылся отель самой дорогой гостиничной сети: стало известно, за сколько в нём можно отдохнуть. А вы уже приценились?

Генеральным директором «585*ЗОЛОТОЙ» стал Дмитрий Лазарев

Спорт в России и мире

Рафаэлю Надалю подмигнул слепой жребий // Первым соперником 14-кратного чемпиона будет четвертая ракетка мира Александр Зверев

Почеттино может возглавить «МЮ», Надаль думает о продолжении карьеры. Главное к утру

Самсонова с «баранкой» разгромила Хаддад-Майю и вышла в полуфинал турнира в Страсбурге

Хромачёва и Сизикова пробились в финал турнира WTA в Рабате в парном разряде

Moscow.media

"Возрождение интереса к народному искусству и ремеслам в современном мире"

Страхование грузов: как «Грузовичкоф» защищает клиентов от убытков 

Сон

Принцеса на горошине.











Топ новостей на этот час

Rss.plus






В папке "Пенсия" лежали 17 млрд рублей: Майор-взяточник переплюнул полковника-миллиардера Захарченко

«Не надо бояться, будет не больно». Захарова удивилась панике США из-за «космического ядерного оружия» Кремля

Победители и члены жюри МКФ «Циолковский» получили специальные награды

В ОЭЗ «Технополис Москва» выпущена серия автомобилей для участия в чемпионате кольцевых гонок