From Vectors of Mind - изображения в оригинале.


[Изображение: Визуальный контент из оригинального поста]Совесть в стиле стимпанк (DALL·E)

Как связана ваша совесть с психозом и эволюцией? Почему психометрика обнаруживает, что успех у людей, социального вида, больше зависит от книжной смекалки, чем от умения общаться с людьми? Должны ли модели личности объяснять, кто мы есть, или как мы сюда попали? И какое отношение это все имеет к языку? Эта серия стремится ответить на эти вопросы.

Спасибо, что читаете Vectors of Mind! Подпишитесь бесплатно, чтобы получать новые посты и поддерживать мою работу.

α и β#

Читатели блога знакомы с происхождением Большой Пятерки. Обратившись к лексической гипотезе, отважные психометрики отправились картировать языковой ландшафт характера. Используя прототипы векторных слов, корреляционные матрицы общих прилагательных были сокращены до нескольких измерений.

[Изображение: Визуальный контент из оригинального поста]Ранний картопсихограф обращается к языку

В 1990-х годах область объединилась вокруг Большой Пятерки, ротации первых пяти главных компонентов таких данных. Аргументы сторонников отражают текущий консенсус о том, что модель может достичь.

“Модель [Пяти Факторов] не предоставляет, и никогда не предназначалась для предоставления, модели динамики личности или развития личности. Это не означает, что измерения Большой Пятерки не могут или не будут объяснены на динамическом и развивающемся уровне, только что модель была разработана для учета эмпирически наблюдаемых отношений между описаниями черт.” Джон и Робинс (1994) Черты и Типы, Динамика и Развитие: Никакие Двери Не Должны Быть Закрыты в Изучении Личности

Личность — одна из самых теоретически насыщенных областей жизни. Люди повсюду — не в последнюю очередь психологи — имеют причинные модели того, как черты связаны и развиваются. Это странная ситуация, когда общая модель области явно молчит по этому вопросу. Хотя есть некоторая теоретическая работа с Большой Пятеркой, это часто включает факторы в 1 или 2 суперфактора (1,2,3,4,5). Первое такое объяснение метачерт было в 1997 году с работой Дигмана Высшие факторы Большой Пятерки. Его метаанализ состоял из PCA на 5x5 корреляционной матрице, представленной в 14 различных исследованиях Большой Пятерки. Первые два фактора были удивительно последовательны во всех исследованиях и соответствовали теоретическим моделям развития. Здесь он описывает первый ПК.

Другая возможность, которая рассматривает факторы как причинные агенты, а не просто как совокупность коррелированных переменных, заключается в том, что Фактор α представляет собой сам процесс социализации. От Фрейда (1930) до Кохута (1977), от Уотсона (1929) до Скиннера (1971), теоретики личности различных убеждений были озабочены развитием сдерживания импульсов и совести, а также снижением враждебности, агрессии и невротической защиты. С этой точки зрения, Фактор α — это то, о чем идет речь в развитии личности. Таким образом, если все идет по плану общества, ребенок развивает суперэго и учится сдерживать или перенаправлять импульсы ид и разряжать агрессию социально одобряемыми способами. Неудача социализации указывается неврозом, недостаточным суперэго или чрезмерной агрессивностью. ~Джон М. Дигман, Высшие факторы Большой Пятерки

Десятилетия спустя все еще ведутся дебаты о легитимности этих факторов. С одной стороны, есть работы, которые находят эти же факторы на многих языках, и связывают их с несколькими другими теоретическими моделями. Тестируя последний случай, Сосье, Талмайер и Пейн исследовали, являются ли четыре различных теоретически выведенных системы в других литературах ротациями и сводимы к Большой Двойке:

  1. Межличностный комплекс

  2. Текущие модели морали/теплоты и компетентности.

  3. Две крупнейшие размерности в отчетах о клинических симптомах — тенденции к интернализации и экстернализации — как они проявляются в нормальных популяциях.

  4. Тенденции подхода и избегания, видный теоретический подход для построения модели биологического процесса.

С другой стороны, некоторые все еще обсуждают, как эти факторы связаны с Большой Пятеркой. Это могло бы быть решено с самого начала путем анализа лексических данных, а не инструментов и конструкций. Рассмотрите эту хорошо цитируемую статью, критическую по отношению к теории Большой Двойки, написанную через десятилетие после открытия Дигмана:

[Изображение: Визуальный контент из оригинального поста]Аннотация Высшие факторы личности: существуют ли они?

Текст взят из аннотации. Иронично, но правильный курс также предложен: “Поэтому гипотезы о высших факторах и смешанных переменных могут быть проверены только с данными о низкоуровневых переменных личности, которые определяют факторы личности.”

α с уровня элементов#

Краеугольный камень Большой Пятерки в том, что они определяются своими словесными нагрузками на общие прилагательные. Что происходит, когда мы выполняем PCA на Большой Пятерке? Мы должны вернуться к “переменным, которые определяют факторы личности” — словам.

[Изображение: Визуальный контент из оригинального поста]Психологи заново открывают Лексическую Гипотезу

Рассмотрите другой угол. Представьте, что у вас есть данные опроса на уровне слов и вы выполняете PCA, извлекая пять факторов. Если вы сообщаете о структуре, повернутой с помощью варимакса (Большая Пятерка), насколько хорошо кто-то другой может восстановить неповернутые факторы?

Хорошая новость в том, что у нас есть данные, чтобы это выяснить. Сосье и Голдберг опубликовали словесные нагрузки Большой Пятерки из 435 прилагательных. Они любезно предоставили данные опроса на уровне элементов. Каждое слово определяется тем, насколько хорошо 900 студентов оценивают его, описывающее их. Из этого мы можем вычислить словесные нагрузки на неповернутые факторы. Я также выполняю PCA на нагрузках Большой Пятерки, представленных в статье. Они коррелированы на рисунке ниже. Следуя Дигману, последние названы греческими буквами. Мы ожидаем восстановить оригинальные факторы, плюс искажение, так как некоторая дисперсия будет дважды учтена из-за варимакс-ротации.

[Изображение: Визуальный контент из оригинального поста]x-ось: неповернутые главные компоненты S&G1996. y-ось: главные компоненты нагрузок слов Большой Пятерки, представленных S&G

Рассчитанные любым способом, первые два ПК выравниваются на 0.8 и 0.91 соответственно. Можно получить довольно хорошее представление о неповернутых факторах, даже когда опубликованы повернутые факторы. Если бы мы были немного сумасшедшими, мы могли бы еще больше удалиться от лексических ПК, разработав инструмент для приближения повернутых факторов (например, BFI). PCA на этих факторах восстановит еще более искажённую версию PC1. Это анализ, который провел Дигман. Обрабатывая данные так далеко от источника, он не мог сделать сильные утверждения о том, как Большая Двойка связана с Большой Пятеркой, языком или общей личностью. Однако, они по своей конструкции являются искаженной версией первых двух неповернутых факторов в лексических данных. Альфа и Бета — это то, чем были бы первые два фактора Большой Пятерки без варимакс-ротации.

Тысячи статей цитируют Дигмана, включая многие, которые оспаривают его утверждения. Насколько мне известно, ни одна из них не делает этого простого аргумента, чтобы объяснить Большую Двойку. В литературе они обычно рассматриваются как иерархически связанные.

Фактически, основная статья, упомянутая выше, анализирует данные на один шаг дальше от языка, чем BFI. Вместо использования данных на уровне элементов или слов, которых у авторов было в избытке, они полагаются на Аспекты Большой Пятерки, которые являются производными от производных Факторов.

Связь с Большой Пятеркой#

Малоизвестный факт в науке о личности заключается в том, что первые факторы значительно превосходят второстепенные факторы Большой Пятерки. Рассмотрите собственные значения 435 прилагательных ниже. Они представляют, сколько дисперсии (информации о личности) объясняет каждый фактор в данных опроса и NLP.

[Изображение: Визуальный контент из оригинального поста]

Первый фактор в 8 раз больше пятого; диспропорция, скрытая под названием Большая Пятерка. Варимакс-ротация приводит к перераспределению информации о личности. Содержание перемещается от первого фактора к остальным. Без этого усиления последние 2-3 фактора являются попутчиками. С добавленной дисперсией они поднимаются до уровня, становясь: Добросовестностью, Невротизмом и Открытостью соответственно. Даже так, Открытость не всегда восстанавливается и часто группируется с другими чертами, такими как интеллект. Эта ротация в ущерб PC1 — α — который становится Доброжелательностью.

[Изображение: Визуальный контент из оригинального поста]

Как видно из таблицы выше, PC1 распределяется по каждому фактору (кроме Невротизма), и Доброжелательность в основном строится из первых трех неповернутых факторов. Некоторая анти-Динамичность берется из PC2, и некоторая анти-Порядок из PC3. (Для получения дополнительной информации о содержании неповернутых факторов см. этот пост, который включает код для их извлечения из языковых моделей.) Кто-нибудь восхищался Доброжелательностью так же, как Дигман восхищался α? Большая часть оригинальной конструкции теряется, с корреляцией всего 0.64. Это искажает простую структуру и привело к многим недоразумениям, включая недооценку теоретической насыщенности лексических данных. Саруман объясняет аналогичный процесс “Вы знаете, как впервые появились Орки? Они были Эльфами когда-то, захваченными темными силами, замученными и изуродованными. Разрушенная и ужасная форма жизни.”

[Изображение: Визуальный контент из оригинального поста]Доброжелательность возникает после лет статистических пыток

Мы могли бы измерять α десятилетиями, но вместо этого получили Доброжелательность и путаницу в том, как они связаны. (Эльф→Орк, оказывается.) Этот аргумент является более красочной версией того, который Дэвид и я приводим в Исследовании 1 Глубокой Лексической Гипотезы: что неясно, оправданы ли последние 2 (или 3) фактора статистически. Очевидно, я также являюсь большим поклонником α и считаю, что никакая модель не может компенсировать распределение идей, которые она содержит. Даже если эта модель содержит дополнительные полезные факторы. (Как заметка, мой соавтор не имеет связи с этой несанкционированной версией аргумента.)

Поскольку у нас есть доступ к данным на уровне слов, давайте более внимательно рассмотрим α.

Что такое α?#

Возвращаясь к языковым данным, мы можем рассмотреть α без искажений, введенных варимакс-ротацией и дизайном инструментов. Конечно, у опросов есть проблемы. Они часто собираются на WEIRD студентах, которые могут или не могут знать определение всех слов. Опросы скучны, и нет большого личного интереса заполнять их точно. Обработка естественного языка решает это, находя отношения слов в порядке величины больше данных, используя текст от говорящих из всех слоев общества. Для тех, кто более знаком с опросами, будьте уверены, два метода коррелируют 0.93 на первом ПК. Используя те же 435 слов, что и Сосье и Голдберг, вот топ-30 слов, загружающихся на каждом полюсе α:

внимательный, мирный, уважительный, добрый, вежливый, неагрессивный, учтивый, согласный, сердечный, разумный, приятный, доброжелательный, сострадательный, понимающий, благотворительный, полезный, уступчивый, кооперативный, дружелюбный, терпимый, скромный, доверчивый, терпеливый, добродушный, альтруистичный, легкий, скромный, бескорыстный, дружелюбный, приземленный, щедрый, дипломатичный, манерный, расслабленный, самоотверженный, искренний, нетребовательный, теплый, тактичный, ласковый

против

оскорбительный, воинственный, неуважительный, сварливый, недобрый, грубый, фанатичный, нетерпимый, невнимательный, некооперативный, раздражительный, мстительный, невежливый, предвзятый, антагонистичный, неблагодарный, сварливый, эгоистичный, жестокий, угрюмый, неотесанный, капризный, презрительный, нетерпеливый, эгоистичный, эгоцентричный, собственнический, жадный, ревнивый, бестактный, боевой, бессердечный, самодовольный, горький, неблаготворительный, несочувствующий, неуправляемый, нестабильный, упрямый, недружелюбный

Дигман предлагает хорошее описание этого фактора, хотя в слишком фрейдистских терминах для этого века. Теперь характеристика будет социальная саморегуляция. Насколько хорошо человек может регулировать свои собственные желания/убеждения/цели, чтобы сделать жизнь приятной для других. Язык — это взгляд со стороны общества; следовательно, α представляет собой одобрение общества.

Сосье отмечает, что Большая Двойка связана с моралью; область, которая была хорошо резюмирована две тысячи лет назад. Говорят, был потенциальный еврейский обращенный, который спросил раввина Гиллеля объяснить закон и пророков, стоя на одной ноге. Он отвечает: “Что ненавистно тебе, не делай ближнему своему: это вся Тора; остальное — комментарий.” Список слов выше также можно свести к Золотому Правилу. Вы внимательны? Вы миротворец? Вы воздерживаетесь от оскорблений?

Вход GFP#

Оказывается, что первый ПК почти любого опроса личности выглядит как α. Опросы о наркотической зависимости, психиатрических расстройствах или вашем мнении о оборотнях — все возвращают подозрительно похожий первый ПК. Это стало известно как общий фактор личности (GFP). Если вы ищете комментарий за пределами “поступай с другими так, как хочешь, чтобы поступали с тобой”, существует обширная литература.

Несмотря на универсальность, все еще ведутся дебаты о том, что это такое. Рассмотрите легкую руку, с которой даже сторонники обобщают ситуацию.

“Многочисленные исследования и метаанализы теперь подтвердили, что черты личности склонны коррелировать таким образом, что возникает общий фактор личности (GFP). Тем не менее, продолжается дебат о том, что эти корреляции, и, следовательно, GFP, представляют. Одно из толкований заключается в том, что GFP отражает содержательный фактор, который указывает на общую социальную эффективность или эмоциональный интеллект. Другое толкование заключается в том, что GFP просто является артефактом, основанным на измерении или предвзятости ответа.” Ван дер Линден и др., Существует ли Значимый Общий Фактор Личности?

Итак, α теперь чаще называется GFP. В дополнение к открытому дебату о его отношении к Большой Пятерке, некоторые считают, что это статистический артефакт. Наконец, как поставлено в заголовке обзора, является ли это значимым общим фактором?

Является ли GFP общим?#

В каком смысле GFP является общим? g является общим, потому что 1) он имеет значительную нагрузку на каждый субтест интеллекта 2) он может объяснить большие пропорции данных теста 3) он обладает высокой внешней надежностью. GFP соответствует первому требованию. Трудно измерить любую конструкцию, не захватив немного GFP.

По второму пункту, Ревелл делает хорошую работу, сравнивая собственные значения, чтобы демонстрировать, что GFP не объясняет столько данных, сколько g. Это на самом деле возвращает нас к тезке блога, Векторы Разума. Исследования интеллекта добились большого успеха в сокращении данных теста до одного измерения. Терстоун понял, что требуется больше, чтобы правильно представить личность. Помните, у нас много слов для того, чтобы описать, является ли кто-то умным; интеллект — это подмножество личности. Таким образом, мы ожидаем, что модель личности будет обязательно более сложной. NLP использует векторные слова, а не скалярные слова, в конце концов. Терстоун изобрел множественный факторный анализ именно по этой причине, требуется более одного фактора!

Кроме того, я хотел бы отметить, что существует методическая предвзятость, которая преувеличивает первое собственное значение в тестах интеллекта. Инструменты разработаны с вопросами, которые либо правильные, либо неправильные. Это психометрически хорошая стратегия; это легко оценить. Хотя это трудно измерить, рассказать увлекательную историю требует интеллекта. Если бы кто-то разработал измеритель, он мог бы действительно коррелировать больше со вторым ПК интеллекта — вербальным уклоном — чем с g. Это не упрек в адрес исследований интеллекта, просто отмечаю, что то, что легко оценить, подчеркивает огромный монополярный первый ПК. Возможно, это хорошее свойство карты, пока она не путается с территорией.

Что приводит нас к третьему пункту. Мое мнение заключается в том, что личность труднее измерить, поэтому сравнение g с оценками личности немного вводит в заблуждение, потому что последние более искажены шумом. Меня интересуют сами черты, которые можно измерить и описать с помощью векторных слов, не вводя никогда инструменты, основанные на людях. Как я уже сказал ранее, перейдите в пространство слов. Даже с этими оговорками, Робертс и др. делают убедительный аргумент, что во многих исследованиях личность на уровне с SES и интеллектом как предиктор жизненных результатов.

Учитывая эти три пункта, я предлагаю другое название для α/GFP: основной фактор личности (PFP). Основной означает:

  1. Наиболее важный; главный.

  2. Самый ранний по времени или порядку.

Фактор личности соответствует обоим. GFP вводит в заблуждение, так как он не аналогичен g; для общей модели требуется больше факторов.

PFP — статистический артефакт?#

Статья 2013 года на эту тему начинается с “Преобладающее мнение о GFP заключается в том, что он представляет собой артефакт, вызванный либо оценочной предвзятостью, либо ответом в социально желаемой манере.” Рассматриваемый лексически, ответ кого? Векторных слов? Весь reddit? Если это артефакт, зачем распространять его на остальную часть Большой Пятерки с помощью варимакс-ротации? Нельзя иметь и то, и другое.

Заключение#

Психометрика — это земля без истинных основ1. Поэтому мы должны ухватиться за Лексическую Гипотезу, когда можем.

"…наш общий запас слов воплощает все различия, которые люди нашли достойными выделения, и связи, которые они нашли достойными обозначения, в течение жизни многих поколений: эти, безусловно, более многочисленны, более обоснованы, так как они выдержали долгий тест выживания наиболее приспособленных, и более тонкие, по крайней мере во всех обычных и разумных практических вопросах, чем любые, которые вы или я, вероятно, придумаем в нашем кресле после обеда — самый любимый альтернативный метод." Дж. Л. Остин, Пожалуйста об Извинениях

Именно по этой причине я предпочитаю описывать PFP как Золотое Правило. Часто дисциплины предпочитают создавать жаргон, который не несет отпечатка миллионов жизней. Существует меньше багажа, и можно говорить более точно, так думается. Но это, как правило, изолирует знания в башне из слоновой кости, оторванной от обыденных — человеческих — реалий. Следующий пост утверждает, что эволюция вдоль PFP преобразила нас из зверя в вид с коллективной совестью. Эта связь труднее увидеть, если PFP мысленно хранится как более стерильная социальная саморегуляция. Возможно, это романтическое предложение, но слова действительно имеют значение.

Это несколько иронично, что успех аргументов Джона в Никакие Двери Не Должны Быть Закрыты в Изучении Личности склонен закрывать двери на исследования на уровне слов. Зачем изучать неудобные словари, когда существуют упрощенные общие факторы? Этот пост взял лексический взгляд на α, β и GFP, что позволило нам ответить на давние вопросы о том, как они связаны с Большой Пятеркой и являются ли они больше, чем статистический артефакт. Очевидны ли эти вещи для тех, кто в области? Есть ли последствия для IO психологии? Что может рассказать нам величина PFP об эволюции и религии?

Подпишитесь сейчас

[Изображение: Визуальный контент из оригинального поста]Ученые открывают Основной Фактор Личности


  1. В своей плотной книге “Часы Разума” Дженсен отмечает, что время реакции — единственная психометрическая переменная с физически значимой единицей. Все остальное должно быть нормировано относительно популяции. Лексическая Гипотеза ценна, так как она предоставляет рамку для физического и социального мира. ↩︎