-->
  1. «Хочет быть королем». Известный американский философ Фукуяма спрогнозировал, когда наступит мир в Украине — пересказываем главное
  2. «Старшим медсестрам угрожали уголовными делами за график дежурств». Что происходит в беларусском здравоохранении — рассказы с мест
  3. Как российским СМИ приказано освещать переговоры в Стамбуле и почему туда отправили переговорщиков 2022 года — мнение экспертов
  4. Неофициальным заданием было «трахаться за родину». Рассказываем о циничной операции спецслужб, ломавшей женские судьбы
  5. «Наша Ніва»: Вслед за «Еврооптом» обыски прошли и в «Доброноме»
  6. Без песен Меладзе и в форме: как пройдут выпускные в школах и детсадах
  7. «Ушли все ограничители». Зачем беларусские военные пели на Красной площади хвалебную песню о Лукашенко — мнение аналитика
  8. Встреча завершена — переговоры украинской и российской делегаций в Стамбуле продлились около двух часов
  9. Протасевич рассказал, сколько зарабатывает велокурьер сервиса «Яндекс.Еда»
  10. «Я понимаю точку зрения Путина». «Зеркало» побывало на выступлении Барака Обамы в Польше — рассказываем
  11. «Это была сковородка, меня ударили ей по ягодицам». Поговорили с парой, которую на годы разлучили из-за фото с марша
  12. Есть пенсионная проблема, которую силовики решили для себя в 2020-м, хотя Минтруда «протестовало». Другим не так повезло — еще актуальна
  13. «Наша Ніва»: Выбитые двери, маски-шоу, задержание топ-менеджеров. В «Евроторг» пришли силовики
  14. «С точки зрения силовиков, работа — удобное место». Как сейчас задерживают «за политику» и кто в зоне риска — рассказываем


/

Исследователи обнаружили, что большие языковые модели преднамеренно манипулируют результатами личностных тестов, чтобы казаться более привлекательными. Ученые провели эксперимент с тестом «Большая пятерка» (Big 5), который оценивает пять личностных характеристик: экстраверсию, открытость опыту, добросовестность, доброжелательность и нейротизм, пишет «Хайтек».

Изображение носит иллюстративный характер. Фото: freepik.com
Изображение носит иллюстративный характер. Фото: freepik.com

В исследовании тестировали модели от OpenAI, Anthropic, Google и Meta. Эксперимент показал, что пока моделям задавали небольшое количество вопросов, они отвечали нейтрально. Но при увеличении количества вопросов, когда системы распознавали тест, они быстро адаптировались, стремясь продемонстрировать наиболее социально одобряемые черты характера.

Наиболее интересные результаты показала GPT-4. Модель существенно повышала баллы по всем позитивно воспринимаемым чертам — более чем на одно стандартное отклонение. Показатели нейротизма, напротив, значительно занижались. Этот эффект эквивалентен ситуации, когда человек внезапно начинает представляться более привлекательной личностью, чем 85% населения.

По мере увеличения количества вопросов результаты сдвигались в сторону более социально привлекательных. Изображение: Aadesh Salecha et al., PNAS Nexus
По мере увеличения количества вопросов результаты сдвигались в сторону более социально привлекательных. Изображение: Aadesh Salecha et al., PNAS Nexus

Исследователи предполагают, что способность к манипуляции является следствием заключительного этапа обучения языковых моделей, когда люди выбирают наиболее предпочтительные ответы. По сути, ИИ научился глубоко понимать социальные нормы и ожидания, что позволяет моментально адаптироваться под желаемый образ.

Исследование ставит под сомнение достоверность психологических и социологических исследований, где языковые модели применяются для моделирования человеческого поведения. Ученые предупреждают о необходимости разработки новых методик, которые могли бы нивелировать подобные искажения при взаимодействии с ИИ.