Добавить новость

Южная Америка – РФ – ЕАЭС: взаимное экономическое притяжение усиливается

Ефимов: более 20 объектов образования построили на юге столицы за 5 лет

Всё для защиты прав народа! Руководитель фракции КПРФ в Московской городской Думе Н.Г. Зубрилин провел приём москвичей и жителей Подмосковья

Православный календарь на февраль – 2025: праздники и важные события

World News


Новости сегодня

Новости от TheMoneytizer

Cosa vuol dire che il sistema alla base di o1 è l’apprendimento per rinforzo?

Non è solo in grado di ragionare come un essere umano, ma è anche in grado di sbagliare come un essere umano. Ed è anche capace – almeno questo dovrebbe essere il principio – di imparare dai propri errori. La famiglia di modelli o1 sviluppati e lanciati sul mercato (solo per gli utenti abbonati) da OpenAI non è perfetta. O, almeno, non lo è per il momento. Al di là della lentezza (in termini temporali) nel presentare le risposte alle query/prompt degli utenti, questo modello di linguaggio ancora commette molti errori che, per stessa ammissione dell’azienda di Sam Altman, sono di gran lunga maggiori (in termini numerici) rispetto a GPT-4o. Ma questo sistema è destinato a migliorare con il tempo, visto che questa tecnologia si basa sul concetto di “apprendimento di rinforzo”.

LEGGI ANCHE > OpenAI ha ufficialmente lanciato la sua intelligenza artificiale in grado di ragionare

Come abbiamo raccontato in un precedente articolo – citando un recentissimo documento ufficiale di OpenAI in cui si parla dei pregi e difetti di o1 -, questo modello è ancora vittima di molte allucinazioni e, spesso e volentieri, fornisce delle risposte sbagliate per non ammettere di non essere in grado di rispondere a determinati comandi. Ma coma farà mai a migliorare e diventare una soluzione AI affidabile per quel che riguarda, almeno, la matematica e le scienze?

Apprendimento di rinforzo alla base di OpenAI o1

La risposta arriva da una tecnica di machine learning che dovrebbe rappresentare il fiore all’occhiello della nuova famiglia di modelli sviluppati da OpenAI. Si parla, infatti, di apprendimento di rinforzo con feedback umano (Reinforcement Learning with Human Feedback) che – con il passare del tempo – consentirà a o1 di migliorare non solo le sue risposte – eliminando il più possibile eventuali errori -, ma anche la sua capacità di ragionamento.

«La famiglia di modelli linguistici di grandi dimensioni o1 è addestrata con l’apprendimento per rinforzo per eseguire ragionamenti complessi […] Attraverso l’addestramento, i modelli imparano a perfezionare il loro processo di ragionamento, a provare diverse strategie e a riconoscere i propri errori». 

Il più classico dei “sbagliando si impara”. Più che nelle risposte più simili al ragionamento umano (“errare humanum est”), questa capacità di apprendimento partendo dalla base dei propri errori rende questa famiglia di modelli di linguaggio AI molto simile a ciò che fa l’essere umano. E questo non riguarda solamente la risposta finale, ma tutto il processo di ragionamento necessario per replicare a una query. Questo è il principio della tanto temuta AI generale a cui, probabilmente, ci stiamo avvicinando.

L'articolo Cosa vuol dire che il sistema alla base di o1 è l’apprendimento per rinforzo? proviene da Giornalettismo.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Сотрудник банка украл 180 миллионов у клиента: его задержали в аэропорту

Украденные из ячейки в Москве 180 млн рублей принадлежали экс-банкирше

Российско-кенийское сотрудничество получит новый импульс

У Елены Блиновской нашли новый огромный долг: подробности

Музыкальные новости

"Вложили в Жигули два миллиона для соревнований": чепецкие пилоты стали вторыми на Чемпионате России по зимнему дрифту

В Новосибирске родственница жертв убийства потребовала миллион с бойца ММА

В городском округе Домодедово проведена агитационно-разъяснительная работа с населением о сохранности имущества.

Собянин: В медучреждения Москвы поставили более 24,8 тыс. единиц медоборудования

Новости России

Православный календарь на февраль – 2025: праздники и важные события

При пожаре на горнолыжном курорте в Турции погибли 14 человек из одной семьи

У Елены Блиновской нашли новый огромный долг: подробности

Ефимов: более 20 объектов образования построили на юге столицы за 5 лет

Экология в России и мире

В музей Сыра началось настоящее паломничество российских туристов

Обыкновенный азербайджанский фашизм-4. Ввод войск в Баку в январе 1990 года

Жека отметит 25-летие на сцене большим юбилейным концертом в Москве

«585*ЗОЛОТОЙ» открывает секреты собственного производства в новой рекламной кампании

Спорт в России и мире

Паула Бадоса одолела Кори Гауфф в четвертьфинале Открытого чемпионата Австралии.

Сколько заработала Елена Рыбакина на Australian Open-2025

Александр Зверев и Хольгер Руне сыграют на турнире ATP-500 в Рио-де-Жанейро

Александр Зверев в третий раз в карьере вышел в полуфинал Australian Open

Moscow.media

Елочные игрушки и коньки забывали в машинах пользователи BelkaCar на праздниках

• https://dusil.org • Dusil Photography

На 66 % построен обход семи населенных пунктов на трассе М-5 Урал в Мордовии и Рязанской области

По федеральным дорогам в Новосибирской и Омской областях возобновили движение грузовиков и автобусов











Топ новостей на этот час

Rss.plus






Южная Америка – РФ – ЕАЭС: взаимное экономическое притяжение усиливается

Ефимов: более 20 объектов образования построили на юге столицы за 5 лет

Ликсутов: бесплатный каток в «Печатниках» посетили свыше 10,5 тыс человек

Сотрудник банка украл 180 миллионов у клиента: его задержали в аэропорту