Добавить новость

Андрей Воробьев: цифровизация поможет ускорить получение документов в Подмосковье

Гребенчатого тритона и чесночницу обыкновенную обнаружили в водоемах Подмосковья

«Известия»: блогеры должны будут получать лицензию для продажи курсов

The Hill: Россия остается неотъемлемой частью стратегического плана Индии



Новости сегодня

Новости от TheMoneytizer

В DeepMind обнаружили, что БЯМ способны к "многократному" обучению

Многие популярные БЯМ способны усваивать новые задачи, используя примеры, представленные во время вывода и обладают способностью обучаться "в контексте". Это означает, что для обучения модели достаточно предоставить ей примеры решенных задач и новую задачу для решения — не нужно менять внутренние параметры. Такой подход упрощает обучение ИИ и делает его доступнее для широкого круга пользователей. Однако, способность модели к обучению ограничена размером окна контекста. Например, у модели GPT-3 это окно составляет всего 2000 токенов, поэтому ей все же нужно менять параметры.

Нынешние модели, такие как Gemini 1.5 Pro, способны работать с более чем миллионом токенов, что позволяет использовать тысячи примеров в каждом запросе. Это расширение возможностей значительно улучшает производительность моделей в различных задачах, таких как перевод малораспространенных языков, решение математических задач, понимание тона текста и другие. По результатам исследований, производительность модели продолжает расти с увеличением количества примеров в запросе.

Тем не менее, существует ограничение, связанное с необходимостью создания большого количества качественных примеров, что особенно затруднительно в задачах, требующих рассуждений. Исследователи предложили две https://venturebeat.com/ai/deepmind-researchers-discover-imp... для уменьшения зависимости от данных, созданных человеком: усиленное ICL (многоразовое обучения в контексте), которое использует примеры, сгенерированные другой моделью, и неконтролируемое ICL, которое опирается на внутренние знания модели о задаче.

В своем исследовании они также обнаружили, что методика ICL помогает модели преодолевать стереотипы мышления, закрепившиеся из-за прежнего обучения. Таким образом можно даже натренировать модель решать задачи, которые не связаны с естественным языком, где обычное обучение на нескольких примерах оказывается неэффективным.

Исследователи полагают, что ICL станет важным инструментом разработки и тестирования новых приложений на основе БЯМ на начальной стадии. Однако на этапе масштабирования проектов важно будет использовать все доступные техники для сокращения токенов. На этой стадии наиболее перспективно задействовать https://hightech.plus/2024/04/23/super-kompaktnaya-ii-model-... .

 

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Недостроенный дом на Радужной улице в Звенигороде снесут до конца года

Крылатые муравьи активизировались в городе

Росреестр зарегистрировал свыше 10 тыс. ДДУ с привлечением кредитных средств 

Турецко-сирийские переговоры: тернистый путь к примирению соседей

Музыкальные новости

Наталья Страшнова стала ведущей программы «Формула Верхневолжья».

Боец ММА Минеев победил Исмаилова на турнире по правилам бокса в Москве

Собянин: Началось строительство подъездной дороги к станции Кокошкино МЦД-4

Google отказалась от ИИ-функции поиска в сервисе Фото из-за технических проблем

Новости России

Подмосковная компания увеличила производство косметических средств на 70% за год

Росія приховано закупила понад 50 танкерів для свого тіньового флоту для перевезення СПГ, — FT

Косметический ремонт в школах Лобни закончат к учебному году

Москва с художниками

Экология в России и мире

Россиян предпочли туркам: в Турции, в отеле забитом российскими туристами, сломались кондиционеры и отдыхающие начали со скандалом перетаскивать кровати в ресторан

Молодёжь сервисного локомотивного депо «Сольвычегодск» филиала «Северный» ООО «ЛокоТех-Сервис» выиграла дорожный этап интеллектуальной лиги ОАО «РЖД» «Что? Где? Когда?»

30 миллионов тормозных колодок выпустило Новосибирское ЛП Желдорреммаш за свою 80-летнюю историю

Marc Jacobs FW-2024/25 (осень-зима 2024)

Спорт в России и мире

Рафаэль Надаль вышел в финал турнира в Бостаде

Медведев в матче против Синнера на Уимблдоне проявил характер, заявил Ольховский

Тарпищев: Рублёву надо не играть, а заняться своим здоровьем

Теннисистка Мария Шарапова снялась без макияжа и укладки

Moscow.media

Москва слезам не верит: в ТПП РФ подержали инициативу по защите прав предпринимателей

Портативный ТСД корпоративного класса Saotron RT-T70

HONDA CIVIC TYPE R И TOYOTA GR COROLLA 2023

Иван-Чайное настроение....











Топ новостей на этот час

Rss.plus






Новое оборудование и увеличение роста производства: при поддержке города производители продуктов питания приобретают линии и расширяют ассортимент продукции

Учёный Баранский дал советы по наблюдению за Персеидами

Московский суд вернул заявителю иск против президента СБР Майгурова

Парень упал на автомобиль на проезде Деженева в Москве