Добавить новость

Инвесторы смогут приобрести помещение в здании XIX века в центре города

У Telegram снова крупный сбой — уже второй за три дня. Что происходит

«Одноклассники» и «Культура.РФ» запустили онлайн-словарь диалектизмов

Пассажиры ЦППК получили почти 4 млн руб. в виде кешбэка за оплату поездок через СБП





Новости сегодня

Новости от TheMoneytizer

Нейросеть сдала ЕГЭ, нейросеть-контролёр и опенсорсная нейросеть «Сайга»

1. Нейросеть от Яндекса доказала, что она знает литературу не хуже обыкновенного школьника, а то и некоторых взрослых (ссылка):
 
Языковая модель YandexGPT 2 стала первой нейросетью, успешно сдавшей ЕГЭ по литературе, набрав 55 баллов. Этот результат превышает минимальный порог для поступления в вуз и приближается к среднему баллу российских школьников. <…>

ЕГЭ по литературе включает в себя различные задания, такие как вопросы на эрудицию, оценку стиля письма и творческих способностей. YandexGPT 2 успешно прошла все этапы: в первой части экзамена модель проанализировала литературное произведение и ответила на вопросы о нем, а во второй части написала сочинение на заданную тему. Работы нейросети проверили живые люди — настоящие специалисты ЕГЭ, которые проверяют работы сотен выпускников ежегодно.

Стоит отметить, что специалисты Яндекса использовали реальные варианты ЕГЭ, применявшиеся на тренировочных экзаменах с 2021 по 2023 годы. Они убедились, что в обучающем наборе данных для YandexGPT 2 ответов на эти вопросы не было.

Основное отличие между сдающими ЕГЭ школьниками и YandexGPT 2 заключается в том, что ученики специально готовятся к экзамену, погружаясь в специфику предмета, в то время как нейросеть работала без специальной подготовки, опираясь только на свои знания. Это сравнимо с тем, как сдавал бы ЕГЭ взрослый человек, не готовившийся к экзамену.


Обычно я весьма скептически отношусь к Алисе, так как она ведёт себя как робкая институтка, отказываясь отвечать даже на самые невинные вопросы, если те имеют хоть малейшее отношение к сложным темам типа политики или взаимоотношений полов. Скрытность — фирменный стиль компании. К примеру, на картах Яндекса нет границ между государствами, чтобы никого не обидеть, а прямо сейчас на Хабре разгорается скандал из-за национального корпуса русского языка, доступом к которому Яндекс отказывается делиться с другими разработчиками ИИ.

Вместе с тем, конкретно по пересказам русской классики ЯндексЖПТ выигрывает у ЖПТ-4. Сравните два пересказа чеховской «Душеньки», первый — от Яндекса, второй — от ЖПТ-4:





Оба пересказа плохи, но пересказ от Яндекса гораздо ближе к сути, тут он побеждает. Впрочем, подобные эксперименты надо ставить на новых текстах — на текстах, на которые робота точно не натаскивали заранее. Мне этого сделать не удалось, так как на просьбу пересказать любой текст из моего блога Алиса отвечала так: «такие темы я не обсуждаю, чтобы никому не было обидно или неприятно».


2. Если нейросети уже достаточно хороши, чтобы сдавать экзамены, значит они вполне могут участвовать и в их проверке (ссылка):
 
Рособрнадзор планирует пропускать через нейросеть работы со всех регионов России на Едином госэкзамене со следующего учебного года, сообщил на пресс-конференции руководитель ведомства Анзор Музаев.

"Да, мы планируем всю страну осматривать, пропускать через нейросеть. И, конечно же, окончательное решение принимает не нейросеть, она только фиксирует, ставит метки, а метки уже человек модератор просматривает и дает окончательный вердикт, действительно там был телефон или шпаргалка или нет", – объяснил он.


Вот это хороший план. Если всё продумать, то в качестве первого звена лучшие нейросети нынешнего поколения будет здорово помогать. Вопрос только вот в этом «всё продумать». Как показывает опыт, государственные структуры часто проваливаются, когда от них требуется пригласить умного человека, чтобы тот объяснил, как правильнее будет всё организовать.


3. Владислав Январёв, автор проекта по созданию удобного доступа к основным российским и иностранным нейросетям (ссылка), пишет, что развитые нейросети бывают не только закрытыми, но и опенсорсными, и приводит в пример отечественную разработку (ссылка):

Сайга-Мистраль — третья русская нейросеть после YaGPT и GigaChat, публично доступная по API. <…>

У нас есть замечательный товарищ, Илья Гусев (на Хабре @Takagi), который берёт некоторые из выходящих зарубежных сетей, и дотренировывает их на русских датасетах (которые он же частично и собрал).

Как результат – у него вышла целая серия опенсорс нейросетей Сайга, в основе которых лежат разные базовые модели <…>

— Вопрос-ответ – хорошие результаты
— Кодогенерация – в общем, тоже хорошие результаты
— Суммаризация – не очень. Думаю, это связано с тем, что сеть всего 7B, а также с тем, что вроде в датасетах Сайги не очень много данных на суммаризацию.
— Knowledge (общие знания без контекста) – также не очень, но тут и сеть всего-то 7B параметров, не удивительно, что специальных знаний там нет.
— Креативность – на мой взгляд, не очень (хотя я интуитивно сравниваю с ChatGPT). При температуре=0.1 отвечает сухо, при 1.0 часто возможен бред; да и вообще стилистика не очень.

Имхо, для вопросно-ответных задач модель очень даже подходит.


Я немного повозился с Сайгой-Мистралью, действительно, интересный продукт. Пока что результатами отечественных разработок я не восхищён, однако они вполне на уровне. Предположу, что сейчас мы отстаём от ОпенАИ примерно на год-два. Это несущественный отрыв.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Прокуратура в очередной раз отчиталась о нарушениях со стороны АНО «Крылатские холмы»

Порядок и спокойствие троичан

В Подмосковье сотрудники Росгвардии за один день пресекли две кражи в охраняемом гипермаркете

«Щедрый подарок»: в Чечне зарегистрировали для беженцев «Палестинскую автономию»

Музыкальные новости

Студенты и сотрудники ГУАП поздравили пенсионеров с Днем пожилого человека

В Калужской области завершился проект «Движение по вертикали. Памяти Станислава Говорухина»

Доброта начинается с малого: сотрудники предприятий холдинга «Швабе» сдали более 60 литров донорской крови

Сотрудники Росгвардии, дислоцированные на территории комплекса «Байконур», приняли участие в товарищеском матче по мини-футболу

Новости России

Объем межтерминальных перевозок увеличился более чем на 7% за 8 месяцев 2024 года – «Деловые Линии»

Комитет по градостроительству и архитектуре согласовал архитектурно-градостроительный облик нескольких объектов

Адвокат Кати Лель заявила, что певица отзывает иск к Кушанашвили

Возлюбленная Григория Лепса раскрыла подробности своей жизни

Экология в России и мире

Спектакль «Раневская. Одинокая насмешница» в Москве: дань великой актрисе

Крутой позывной для армии

Последняя выпущенная песня Вячеслава Добрынина “Родная Земля”, исполненная Сергеем Арутюновым и Львом Лещенко, навсегда сохранит память о великом композиторе

Спектакль «Раневская. Одинокая насмешница» в Москве: дань великой актрисе

Спорт в России и мире

Хачанов обыграл Черундоло и вышел в четвертьфинал турнира ATP в Пекине

Медведев проиграл Алькарасу в полуфинале турнира ATP в Пекине

Теннисист Рублев: после US Open мне грозила ампутация

Мирра Андреева дебютирует в топ-20 рейтинга WTA

Moscow.media

ТСД SAOTRON RT41 GUN: практичный, производительный, надёжный

Bluetooth-сканер штрих-кодов SAOTRON P04 на базе CMOS-матрицы

Из реки около моста выловили тело мужчины

SIMETRA разработает транспортную модель дорожной развязки в Чебоксарах











Топ новостей на этот час

Rss.plus






Казань принимает лучшие российские команды по фитнес-аэробике

Коктейли на основе водки: рецепты сочетаний для приготовления дома

Резиденты ОЭЗ Подмосковья создали 1,5 тысячи рабочих мест в этом году

Ставка на осознанность: букмекеров заставят сбавить обороты