摘自 Vectors of Mind —— 图片见原文。
先从宏大理论中退一步,这篇文章重新审视那些神秘的词汇因素。仅凭词语载荷,你能描述出把一个因素维系在一起的一般原则吗?这个练习直指人格模型最终的定性本质。尽管我们使用统计方法来生成词语载荷,但一个模型最终必须用词语而不是数字来进行表述。随后,这些描述被用来生成量表(例如 BFI),以近似每一个构念。
这里讨论的因素数据来自两个来源。一个因素来自词向量,另一个来自传统的问卷调查方法。这两种过程都在这里进行了描述。如果你想先在一个未标注的图上尝试给这些因素命名,可以在继续往下读之前先看看这篇文章。
神秘因素 1#
高载荷词:exacting, strict, decisive, stern, firm 对比 meek, lax, wishy-washy, gullible, naive
评论者将其描述为:尽责性(conscientiousness)、自信果断(assertiveness)、勤勉(industriousness)以及 Attended Action。
干得不错,各位!这基本涵盖了该因素。它是从词向量数据中提取的未旋转第三主成分。在过去,我曾称其为 Order,以将其与大五人格中的 Conscientiousness 区分开来。二者相似,但这个因素更“锋利”一些(例如 exacting, vengeful)。Order 关乎的是不惜一切代价抓住并实现自己的目标。大五中的 Conscientiousness 则从 PC1(PFP)中吸收了一部分方差,并与 Order 混合,形成 Conscientiousness。因此,unforgiving 与 Order 强烈相关,但在 Conscientiousness 上则是中性的。
在我看来,把实现个人目标的能力与实现社会目标的愿望混合在一个构念中,会让情况变得混乱。比如,我认为工业与组织(IO)研究若使用 Order,而不是 Conscientiousness 或 grit,会更好。那些感兴趣的相关变量(如晋升)显然与 Order 更直接相关。我从未见过一个处在顶层的人是纯粹的“团队玩家”。总会带着一点个人锋芒。
神秘因素 2#
高载荷词:unimaginative, unsophisticated, moral, empathic, principled 对比 crafty, cunning, sly, creative, clever
评论者将其描述为:负向开放性(negative openness)、勤勉(industriousness)以及 Trust of Word。
这个就更棘手一些,因为它实际上是一个经典论文中所用数据的第 6 个未旋转主成分,而这篇论文最初是用来界定大五人格的。这就是他们对你隐瞒的东西! 这就是当时被“砍掉”的部分。有趣的是,在那份数据中,第五和第六个因素都与经验开放性(openness to experience)有关。当然,从统计上看,把模型截断在五个因素可能有其理由。但从质性角度看,最后那个因素被拆成了两个因素,而只有一半的信号被保留下来。这更像是一种奇特现象,而非别的什么。我也不知道在其他数据集中是否同样成立。
[图片:原文中的可视化内容]使用来自词向量和问卷调查的数据,对 435 个词进行了因素分解。第三个未旋转因素从词向量(NLP)中选取,第六个则来自问卷调查。为了在图中容纳这些词,只展示了 150/435 个词。这 150 个词是随机选取的,因此与上一篇文章中的子集不同。
希望你喜欢这个小练习。在读研时,当我开发从词向量中提取词语载荷的方法时,我完全不知道结果究竟是信号还是噪音。一开始,大多数时候都是噪音,我花了很多时间在词语载荷中“读茶叶”,期望能看到某个统一的心理构念。时间所剩无几,而在 NLP 的前 2–3 个因素中,只有在你“眯着眼看”的情况下,才能在大五中找到对应。发现大二人格——而且我可以完美地将其复原——所带来的情绪释放,是我偏爱它们的部分原因。相比那种“勉勉强强复原了大五的一半”,这是一个更有说服力的故事,可以写进论文。