Добавить новость

Англичанка из Симбирска

"Я нужен России": Степан Меньщиков объяснил развод с женой тоской по Родине

Лавров провел встречу с главой администрации президента Белоруссии

Утреннее чтиво: создание национального центра, Всемирный банк признал, смертельный ураган в Питере



Новости сегодня

Новости от TheMoneytizer

Нейросеть сдала ЕГЭ, нейросеть-контролёр и опенсорсная нейросеть «Сайга»



1. Нейросеть от Яндекса доказала, что она знает литературу не хуже обыкновенного школьника, а то и некоторых взрослых (ссылка):
 
Языковая модель YandexGPT 2 стала первой нейросетью, успешно сдавшей ЕГЭ по литературе, набрав 55 баллов. Этот результат превышает минимальный порог для поступления в вуз и приближается к среднему баллу российских школьников. <…>

ЕГЭ по литературе включает в себя различные задания, такие как вопросы на эрудицию, оценку стиля письма и творческих способностей. YandexGPT 2 успешно прошла все этапы: в первой части экзамена модель проанализировала литературное произведение и ответила на вопросы о нем, а во второй части написала сочинение на заданную тему. Работы нейросети проверили живые люди — настоящие специалисты ЕГЭ, которые проверяют работы сотен выпускников ежегодно.

Стоит отметить, что специалисты Яндекса использовали реальные варианты ЕГЭ, применявшиеся на тренировочных экзаменах с 2021 по 2023 годы. Они убедились, что в обучающем наборе данных для YandexGPT 2 ответов на эти вопросы не было.

Основное отличие между сдающими ЕГЭ школьниками и YandexGPT 2 заключается в том, что ученики специально готовятся к экзамену, погружаясь в специфику предмета, в то время как нейросеть работала без специальной подготовки, опираясь только на свои знания. Это сравнимо с тем, как сдавал бы ЕГЭ взрослый человек, не готовившийся к экзамену.


Обычно я весьма скептически отношусь к Алисе, так как она ведёт себя как робкая институтка, отказываясь отвечать даже на самые невинные вопросы, если те имеют хоть малейшее отношение к сложным темам типа политики или взаимоотношений полов. Скрытность — фирменный стиль компании. К примеру, на картах Яндекса нет границ между государствами, чтобы никого не обидеть, а прямо сейчас на Хабре разгорается скандал из-за национального корпуса русского языка, доступом к которому Яндекс отказывается делиться с другими разработчиками ИИ.

Вместе с тем, конкретно по пересказам русской классики ЯндексЖПТ выигрывает у ЖПТ-4. Сравните два пересказа чеховской «Душеньки», первый — от Яндекса, второй — от ЖПТ-4:





Оба пересказа плохи, но пересказ от Яндекса гораздо ближе к сути, тут он побеждает. Впрочем, подобные эксперименты надо ставить на новых текстах — на текстах, на которые робота точно не натаскивали заранее. Мне этого сделать не удалось, так как на просьбу пересказать любой текст из моего блога Алиса отвечала так: «такие темы я не обсуждаю, чтобы никому не было обидно или неприятно».


2. Если нейросети уже достаточно хороши, чтобы сдавать экзамены, значит они вполне могут участвовать и в их проверке (ссылка):
 
Рособрнадзор планирует пропускать через нейросеть работы со всех регионов России на Едином госэкзамене со следующего учебного года, сообщил на пресс-конференции руководитель ведомства Анзор Музаев.

"Да, мы планируем всю страну осматривать, пропускать через нейросеть. И, конечно же, окончательное решение принимает не нейросеть, она только фиксирует, ставит метки, а метки уже человек модератор просматривает и дает окончательный вердикт, действительно там был телефон или шпаргалка или нет", – объяснил он.


Вот это хороший план. Если всё продумать, то в качестве первого звена лучшие нейросети нынешнего поколения будет здорово помогать. Вопрос только вот в этом «всё продумать». Как показывает опыт, государственные структуры часто проваливаются, когда от них требуется пригласить умного человека, чтобы тот объяснил, как правильнее будет всё организовать.


3. Владислав Январёв, автор проекта по созданию удобного доступа к основным российским и иностранным нейросетям (ссылка), пишет, что развитые нейросети бывают не только закрытыми, но и опенсорсными, и приводит в пример отечественную разработку (ссылка):

Сайга-Мистраль — третья русская нейросеть после YaGPT и GigaChat, публично доступная по API. <…>

У нас есть замечательный товарищ, Илья Гусев (на Хабре @Takagi), который берёт некоторые из выходящих зарубежных сетей, и дотренировывает их на русских датасетах (которые он же частично и собрал).

Как результат – у него вышла целая серия опенсорс нейросетей Сайга, в основе которых лежат разные базовые модели <…>

— Вопрос-ответ – хорошие результаты
— Кодогенерация – в общем, тоже хорошие результаты
— Суммаризация – не очень. Думаю, это связано с тем, что сеть всего 7B, а также с тем, что вроде в датасетах Сайги не очень много данных на суммаризацию.
— Knowledge (общие знания без контекста) – также не очень, но тут и сеть всего-то 7B параметров, не удивительно, что специальных знаний там нет.
— Креативность – на мой взгляд, не очень (хотя я интуитивно сравниваю с ChatGPT). При температуре=0.1 отвечает сухо, при 1.0 часто возможен бред; да и вообще стилистика не очень.

Имхо, для вопросно-ответных задач модель очень даже подходит.


Я немного повозился с Сайгой-Мистралью, действительно, интересный продукт. Пока что результатами отечественных разработок я не восхищён, однако они вполне на уровне. Предположу, что сейчас мы отстаём от ОпенАИ примерно на год-два. Это несущественный отрыв.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Лавров провел встречу с главой администрации президента Белоруссии

Англичанка из Симбирска

Собянин представил результаты четырех лет работы Агентства креативных индустрий

Суд удовлетворил исковые требования Магаданского транспортного прокурора о признании движимого имущества бесхозяйным

Музыкальные новости

Пер-во г.Люберцы-на призы БФ Люберецкий Квартал 24-30.06.2024

До 15 лет лишения свободы: По делу о терроризме задержали тренера молодёжной сборной России по борьбе

ВККС получил запрос Бастрыкина об уголовном деле против главы Солнцевского суда

S&P повысило прогноз по рейтингу «дочек» Freedom Holding Corp. до позитивного

Новости России

Кольцо на Московском проспекте: у A42.RU появилась новая камера в Кемерове

Беспилотник США MQ-9 Reaper опасно приблизился к российскому Ан-30 в Сирии

За полгода погрузка на сети РЖД упала на 3%

Лавров провел встречу с главой администрации президента Белоруссии

Экология в России и мире

К чему чешется глаз: чует кулак или что-то другое?

"Интеррос", "Атомайз", Эрмитаж и Т-Банк готовят второй этап проекта «Цифровое искусство»

Ужалила медуза: что делать и как себя вести, рассказал доктор Кутушов

В Москве состоится выставка «Textile&Home-2024. Осень»

Спорт в России и мире

Зарубежное СМИ оценило шансы «больной» Рыбакиной на старте Уимблдона-2024

Медведев остался на пятом месте в рейтинге ATP перед стартом Уимблдона

Уимблдон. 1 июля. Мирра Андреева и Синнер сыграют последним запуском, Медведев стартует в 15:00

Анна Калинская и Янник Синнер были замечены вместе на Уимблдоне

Moscow.media

Ночью в микрорайоне Алроса в Орле горела квартира

Столичные росгвардейцы оказали помощь гражданину, получившему серьезную травму

Портативный ТСД корпоративного класса Saotron RT-T70

Utrace выходит на рынок маркировки бакалейной продукции











Топ новостей на этот час

Rss.plus






Беспилотник США MQ-9 Reaper опасно приблизился к российскому Ан-30 в Сирии

"Я нужен России": Степан Меньщиков объяснил развод с женой тоской по Родине

Первая неделя Игр: счастье и слёзы детей

Суд удовлетворил исковые требования Магаданского транспортного прокурора о признании движимого имущества бесхозяйным