来自 Vectors of Mind - 原文中的图像。
[图像:原文中的视觉内容]蒸汽朋克良知 (DALL·E)
你的良知与精神病和进化有什么关系?为什么心理测量学发现在人类这种社会性物种中,成功更依赖于书本智慧而非人际智慧?人格模型应该解释我们是谁还是我们如何到达这里?这一切与语言有什么关系?本系列旨在回答这些问题。
感谢阅读 Vectors of Mind!免费订阅以接收新文章并支持我的工作。
α 和 β#
博客的读者对大五人格的起源并不陌生。勇敢的心理测量学家依靠词汇假设,着手绘制性格的语言景观。使用原始词向量,常用形容词的相关矩阵被简化为几个维度。
[图像:原文中的视觉内容]早期的心理地图学家关注语言
在20世纪90年代,该领域围绕大五人格模型凝聚在一起,这是对这些数据的前五个主成分的旋转。支持者的论点反映了当前关于模型能实现什么的共识。
“[五因素模型] 并未提供,也从未打算提供一个人格动态或人格发展的模型。这并不意味着大五维度不能或不会在动态和发展层面上得到解释,只是该模型是为了说明特质描述之间的经验观察关系而开发的。” John 和 Robins (1994) Traits and Types, Dynamics and Development: No Doors Should Be Closed in the Study of Personality
人格是生活中理论最丰富的领域之一。世界各地的人们——尤其是心理学家——都有关于特质如何关联和发展的因果模型。对于该领域的通用模型在这个话题上明确保持沉默,这是一种奇怪的情况。虽然有一些关于大五人格的理论工作,但这通常涉及将因素归结为1或2个超因素(1,2,3,4,5)。第一个这样的元特质解释是在1997年由Digman的大五的高阶因素提出的。他的元分析由14个不同大五研究中报告的5x5相关矩阵的PCA组成。前两个因素在研究中表现出惊人的一致性,并与发展理论模型一致。这里他描述了第一个主成分。
另一种可能性是,将因素视为因果代理,而不仅仅是相关变量的集合,即因素α代表了社会化过程本身。从弗洛伊德(1930)到科胡特(1977),从华生(1929)到斯金纳(1971),各种观点的人格理论家都关注于冲动抑制和良知的发展,以及敌意、攻击性和神经质防御的减少。从这个角度来看,因素α就是人格发展的全部。因此,如果一切按照社会的蓝图进行,孩子就会发展出超我,学会抑制或重定向本我冲动,并以社会认可的方式释放攻击性。社会化的失败表现为神经症、超我缺陷或过度攻击性。 ~John M. Digman, 大五的高阶因素
几十年后,这些因素的合法性仍然存在争议。一方面,有研究发现这些相同的因素在多种语言中存在,并将它们与其他几个理论模型联系起来。测试后一种情况,Saucier、Thalmayer和Payne探讨了其他文献中四个不同理论派生系统是否是大二的旋转并可简化为大二:
人际复杂性
当前的道德/温暖和能力模型。
临床症状报告中的两个最大维度——内化和外化倾向——在正常范围人群中的表现。
接近和回避倾向,这是构建生物过程模型的一个显著理论方法。
另一方面,有些人仍在争论这些因素与大五之间的关系。这本可以通过分析词汇数据而不是工具和构造来从一开始就解决。考虑这篇在Digman发现十年后撰写的批评大二理论的被广泛引用的论文:
[图像:原文中的视觉内容]人格的高阶因素:它们存在吗?的摘要
文本摘自摘要。具有讽刺意味的是,正确的做法也被建议了:“因此,高阶因素和混合变量的假设只能通过定义人格因素的低阶人格变量的数据来测试。”
从项目层面的α#
大五的基石是它们由常用形容词的词负荷定义。当我们对大五进行PCA时会发生什么?我们必须回到“定义人格因素的变量”——词语。
[图像:原文中的视觉内容]心理学家重新发现词汇假设
考虑另一种角度。想象你有词汇层面的调查数据并进行PCA,提取五个因素。如果你报告了经过varimax旋转的结构(大五),别人能多好地恢复未旋转的因素?
好消息是,我们有数据可以找出答案。Saucier和Goldberg发表了435个形容词的词大五负荷。他们友好地提供了项目层面的调查数据。每个词由900名学生评价其描述他们的程度来定义。从中我们可以计算出未旋转因素的词负荷。我还对论文中报告的大五负荷进行了PCA。这些在下图中相关。遵循Digman的命名,后者用希腊字母命名。我们期望恢复原始因素,加上由于varimax旋转而导致的一些失真。
[图像:原文中的视觉内容]x轴:S&G1996的未旋转主成分。y轴:S&G报告的大五词负荷的主成分
无论哪种方式计算,前两个主成分分别对齐为0.8和0.91。即使发布了旋转因素,也可以对未旋转因素有一个相当好的了解。如果我们感到疯狂,我们_可以_通过设计一个仪器来近似旋转因素(例如BFI)来进一步远离词汇主成分。对这些因素进行PCA将恢复一个更加失真的PC1版本。这是Digman进行的分析。数据处理如此远离源头,他无法就大二与大五、语言或一般人格的关系做出强有力的声明。然而, 它们通过构造是词汇数据中前两个未旋转因素的失真版本。 Alpha和Beta是大五的前两个因素在没有varimax旋转时的样子。
成千上万的论文引用了Digman,包括许多反驳他的主张的论文。据我所知,没有一篇论文提出这个简单的论点来解释大二。在文献中,它们通常被视为_层次上_相关的。
事实上,上述的主要论文分析的数据比BFI更远离语言。作者们没有使用他们丰富的项目或词汇层面数据,而是依赖于大五方面,这些是派生因素的派生物。
与大五的关系#
人格科学中一个鲜为人知的事实是,第一个因素远远超过大五的小因素。考虑下面435个形容词的特征值。它们代表每个因素在调查和NLP数据中解释的方差(人格信息)。
第一个因素是第五个因素的8倍;这种差异被一个像大五这样的名字掩盖了。Varimax旋转导致人格信息的重新分配。内容从第一个因素转移到其余因素。没有这种提升,最后2-3个因素只是附属品。随着增加的方差,它们被提升到与之相当,分别成为:尽责性、神经质和开放性。即便如此,开放性并不总是被一致恢复,且常常与其他特质如智力分组。这种旋转对PC1—α—不利,它变成了宜人性。
如上表所示,PC1被分配到每个因素(除了神经质),而宜人性主要由前三个未旋转因素构成。一些反动力来自PC2,一些反秩序来自PC3。(有关未旋转因素内容的更多信息,请参见此帖子,其中包括从语言模型中推导它们的代码。)有人像Digman那样对α进行过如此优雅的描述吗?原始构造的大部分丢失了,仅有0.64的相关性。这破坏了简单结构并导致了许多混淆,包括低估词汇数据的理论丰富性。萨鲁曼解释了一个类似的过程:“你知道兽人是如何诞生的吗?他们曾经是精灵,被黑暗力量俘获,折磨和残害。是一种被毁坏和可怕的生命形式。”
[图像:原文中的视觉内容]宜人性在多年的统计折磨后出现
我们本可以测量α几十年,但我们得到了宜人性和关于两者关系的困惑。(精灵→兽人,事实证明。)这个论点是我和David在深层词汇假设的研究1中提出的一个更生动的版本:最后2(或3)个因素是否在统计上有依据并不明确。显然,我_也_恰好是α的忠实粉丝,并认为没有模型可以弥补其所包含的思想的分布。即使该模型包含其他有用的因素。(作为说明,我的合著者与这个未经授权的论点版本没有联系。)
因为我们有词汇层面的数据,让我们更仔细地看看α。
α是什么?#
通过回到语言数据,我们可以看到α而不受varimax旋转和仪器设计引入的失真。当然,调查存在问题。它们通常在WEIRD本科生中收集,这些学生可能知道或不知道所有词的定义。调查很无聊,准确填写它们没有太多个人利益。自然语言处理通过使用来自各行各业的演讲者的文本在数量级上更多的数据中找到词汇关系来解决这个问题。对于那些更熟悉调查的人,请放心,这两种方法在第一个主成分上相关0.93。使用与Saucier和Goldberg相同的435个词,以下是每个α极的前30个词负荷:
体贴、和平、尊重、善良、有礼貌、不具攻击性、礼貌、宜人、亲切、合理、愉快、仁慈、富有同情心、理解、慈善、乐于助人、随和、合作、和蔼、宽容、谦虚、信任、耐心、和蔼、无私、随和、谦逊、无私、友好、务实、慷慨、外交、礼貌、放松、无私、真诚、不苛求、温暖、机智、亲切
对比
虐待、好斗、不尊重、争吵、不友善、粗鲁、偏执、偏狭、不体贴、不合作、易怒、报复心强、不礼貌、偏见、对抗、不和蔼、暴躁、自私、残忍、粗鲁、粗俗、暴躁、轻蔑、不耐烦、自私、自我中心、占有欲强、贪婪、嫉妒、不机智、好斗、冷酷、自负、苦涩、不慈善、无同情心、不守规矩、不稳定、固执、不友好
Digman提出了这个因素的一个很好的描述,尽管用词太过弗洛伊德化。现在的描述将是社会自我调节。一个人能多好地调节自己的欲望/信念/目标以使他人生活愉快。语言是社会的视角;因此α代表了社会的认可。
Suacier指出大二与道德有关;这是一个两千年前就被很好总结的领域。据说有一个未来的犹太教皈依者要求拉比希勒尔在单脚站立时解释律法和先知。他回答说:“你所厌恶的,不要对你的同伴做:这就是整个律法;其余的是注释。”上面的词汇列表也可以简化为黄金法则。你是否体贴?你是否促成和平?你是否避免虐待?
进入GFP#
事实证明,几乎任何人格调查的第一个主成分看起来都像α。药物依赖、精神障碍或你对狼人有什么看法的调查——都返回一个可疑相似的第一个主成分。这被称为人格的_一般_因素(GFP)。如果你在寻找超越“己所不欲,勿施于人”的_注释_,有一个广泛的文献。
尽管具有普遍性,但关于它是什么的争论仍在继续。考虑即使是支持者对总结情况时的轻描淡写。
“许多研究和元分析现在已经证实人格特质倾向于相关,以至于出现了一个一般人格因素(GFP)。然而,关于这些相关性以及因此GFP代表什么的争论仍在继续。一种解释是GFP反映了一个实质性因素,表明一般的社会效能或情商。另一种解释是GFP仅仅是基于测量或反应偏差的产物。” Van der Linden等,是否存在有意义的一般人格因素?
因此,α现在更常被称为GFP。除了关于它与大五关系的公开辩论外,有些人认为它是一个统计产物。最后,如评论标题所示,它是一个_有意义的_一般因素吗?
GFP是一般的吗?#
GFP在何种意义上是一般的?_g_是一般的,因为1)它在每个智力子测验上都有实质性负荷 2)它可以解释大量的测试数据 3)它具有高度的外部可靠性。GFP满足第一个要求。很难测量任何构造而不拾取一些GFP。
关于第二点,Revelle做了很好的工作,通过比较特征值来证明GFP并不像_g_那样解释数据。这实际上可以追溯到博客的名字,心灵的向量。智力研究在将测试数据简化为一个维度方面取得了巨大成功。Thurstone意识到需要更多的维度来正确表示人格。记住,我们有很多词来描述一个人是否聪明;智力是人格的一个子集。因此,我们期望人格模型必然更复杂。NLP使用词向量,而不是词标量,毕竟。Thurstone发明了多因素分析正是出于这个原因,需要不止一个因素!
此外,我想指出,智力测试上存在方法偏差,这夸大了第一个特征值。仪器设计的问题是要么对要么错。这在心理测量学上是一个好的策略;它很容易评分。虽然很难测量,讲一个引人入胜的故事需要智力。如果有人确实设计了一个量表,它可能确实与智力的第二个主成分——语言倾向——而不是_g_更相关。这不是对智力研究的挖苦,只是指出容易评分的东西强调了巨大的单极第一个主成分。也许是地图的一个好属性,只要它不被误认为是领土。
这将我们带到第三点。我的观点是人格更难测量,因此将_g_与人格分数进行比较有点误导,因为后者更容易被噪音污染。我对特质本身感兴趣,这些特质可以通过词向量进行测量和描述,而无需引入基于人的仪器。正如我之前所说,转换到词空间。即使有这些警告,Roberts等人做了一个令人信服的案例,在许多研究中人格与SES和智力一样是生活结果的预测因子。
考虑到这三点,我建议为α/GFP另一个名称:人格的主要因素(PFP)。主要意味着:
最重要的;主要的。
时间或顺序上最早的。
人格因素符合这两者。GFP具有误导性,因为它不类似于_g_;需要更多的因素来构建一个_一般_模型。
PFP是统计产物吗?#
一篇2013年的论文在这个主题上开篇_“GFP的压倒性主流观点是它代表了一种由于评价偏差或以社会期望方式反应的产物。”_从词汇角度来看,谁的反应?词向量?整个reddit?如果它是一个产物,为什么要通过varimax旋转将其分散到大五的其余部分?不能两者兼得。
结论#
心理测量学是一个没有地面真相的领域1。因此,我们应该在可能时抓住词汇假设。
“……我们共同的词汇储备体现了人们在许多代人的一生中发现值得划分的所有区别,以及他们发现值得标记的联系:这些肯定比你我在一个下午的扶手椅上想出来的任何东西都要多、要合理,因为它们经受住了适者生存的长期考验,并且在所有普通和合理的实际事务中更为微妙。” J.L. Austin, A Plea for Excuses
正因为如此,我更喜欢将PFP描述为黄金法则。学科通常更喜欢构建不带有数百万生命印记的术语。这样做的想法是减少负担,并且可以更精确地表达。但这往往会将知识隔离在象牙塔中,与世俗——人类——现实脱节。下一篇文章论证了沿着PFP的进化将我们从野兽转变为一个具有集体良知的物种。如果PFP在心理上被存储为更为无菌的_社会自我调节_,这种联系就更难看出。也许是一个浪漫的命题,但语言确实很重要。
具有讽刺意味的是,John在No Doors Should Be Closed in the Study of Personality中的论点成功往往关闭了对词汇层面研究的大门。为什么要研究难以驾驭的词汇,当简化的一般因素存在时?这篇文章从词汇角度看待α、β和GFP,使我们能够回答长期以来关于它们如何与大五相关以及它们是否不仅仅是统计产物的问题。这些事情对该领域的人来说显而易见吗?对IO心理学有什么影响?PFP的规模能告诉我们关于进化和宗教的什么?
[图像:原文中的视觉内容]科学家发现人格的主要因素
在他密集的《Clocking the Mind》中,Jensen指出反应时间是唯一具有物理意义单位的心理测量变量。其他一切都必须相对于一个群体进行标准化。词汇假设很有价值,因为它提供了一个与物理和社会世界的参考框架。 ↩︎