Добавить новость

Бывший заместитель губернатора заживо сгорел на даче

В России и Белоруссии решили отменить роуминг в 2025 году

Десять педагогов из Псковской области отправились на марафон «Знание.Первые»

Бывший замгубернатора Тульской области погиб при пожаре

News in English


Новости сегодня

Новости от TheMoneytizer

Stick to your role! Stability of personal values expressed in large language models

by Grgur Kovač, Rémy Portelas, Masataka Sawayama, Peter Ford Dominey, Pierre-Yves Oudeyer

The standard way to study Large Language Models (LLMs) through benchmarks or psychology questionnaires is to provide many different queries from similar minimal contexts (e.g. multiple choice questions). However, due to LLM’s highly context-dependent nature, conclusions from such minimal-context evaluations may be little informative about the model’s behavior in deployment (where it will be exposed to many new contexts). We argue that context-dependence should be studied as another dimension of LLM comparison alongside others such as cognitive abilities, knowledge, or model size. In this paper, we present a case-study about the stability of value expression over different contexts (simulated conversations on different topics), and as measured using a standard psychology questionnaire (PVQ) and behavioral downstream tasks. We consider 21 LLMs from six families. Reusing methods from psychology, we study Rank-order stability on the population (interpersonal) level, and Ipsative stability on the individual (intrapersonal) level. We explore two settings: with and without instructing LLMs to simulate particular personalities. We observe similar trends in the stability of models and model families—Mixtral, Mistral, GPT-3.5 and Qwen families being more stable than LLaMa-2 and Phi—over those two settings, two different simulated populations, and even on three downstream behavioral tasks. When instructed to simulate particular personas, LLMs exhibit low Rank-Order stability, and this stability further diminishes with conversation length. This highlights the need for future research directions on LLMs that can coherently simulate a diversity of personas, as well as how context-dependence can be studied in more thorough and efficient ways. This paper provides a foundational step in that direction, and, to our knowledge, it is the first study of value stability in LLMs. The project website with code is available at https://sites.google.com/view/llmvaluestability.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Сотрудники Росгвардии обеспечили правопорядок на хоккейном матче в Москве

Бывший замгубернатора Тульской области погиб при пожаре

В МИД РФ заявили о дискриминации Кишинёвом молдавских избирателей, проживающих в России

Десять педагогов из Псковской области отправились на марафон «Знание.Первые»

Музыкальные новости

Оскар Кучера посетил Единый пункт отбора на военную службу в Москве

Nowhere House 1.1.18

Николай Цискаридзе на марафоне Знание.Первые: «Если человек развивается, он живет»

Джиган, Artik & Asti и NILETTO спели о худи, а Дина Саева стала новым артистом: в Москве прошел музыкальный бранч

Новости России

Наталья Водянова появилась на обложке Madame Figaro

Осужденный на 12,5 лет в РФ американец признал вину по делу о наркотиках

Сильный ветер сорвал деревья и рекламные щиты в Махачкале

В Сети появились первые снимки бокового отсека Су-57 для ракет Р-74

Экология в России и мире

Литературные пристрастия Виктории и Дэвида Бекхэмов: супруги читают триллеры одного автора

«Я в домике!»: зачем ребенку нужно собственное пространство

Уральская ТПП реализует важные межнациональные проекты и укрепляет народное единство

Ротавирус – правда ли помогает кола? Рассказал гастроэнтеролог Рустем Садыков

Спорт в России и мире

Париж (ATP). 1/4 финала. Хачанов сыграет с Димитровым, Зверев – с Циципасом, Руне встретится с де Минауром, Эмбер – с Томпсоном

Российская теннисистка Шнайдер вышла в полуфинал турнира WTA в Гонконге

Прямая трансляция первого матча Елены Рыбакиной на Итоговом турнире WTA

Медведев обошел Джоковича в рейтинге АТР

Moscow.media

Главная арка ВДНХ

*Meta незаконно использовала финансовые данные пользователей в рекламе

«Ничего, что можно было бы назвать GPT-5» — OpenAI дорабатывает GPT-o1, а GPT-5 не появится в 2024 году

Актерское агентство Киноактер. Актерское агентство в Москве.











Топ новостей на этот час

Rss.plus






В Сети появились первые снимки бокового отсека Су-57 для ракет Р-74

Сильный ветер сорвал деревья и рекламные щиты в Махачкале

Осужденный на 12,5 лет в РФ американец признал вину по делу о наркотиках

Мужчина заживо сжег свою жену в общежитии в подмосковном Ногинске