来自 Vectors of Mind - 原文中的图像。
从宏大的理论中退一步,这篇文章重新审视了神秘的词汇因素。从词汇负载中,你能描述出维系一个因素的基本原则吗?这个练习揭示了人格模型最终的定性特征。尽管使用统计方法生成词汇负载,模型最终必须用文字而非数字来传达。这些描述随后用于生成近似每个构念的量表(例如,BFI)。
所讨论因素的数据来自两个来源。一个因素来自词向量,另一个来自传统的调查方法。两种过程的描述见这里。如果你想在未标记的图上尝试命名这些因素,请在阅读下文之前查看这个帖子。
神秘因素1#
主要词汇:严格的、严厉的、果断的、坚定的、坚决的对比温顺的、松懈的、优柔寡断的、轻信的、天真的
评论者将其描述为:尽责性、果断性、勤勉性和有计划的行动。
干得好,团队!这基本上涵盖了这个因素。它是从词向量数据的未旋转第三成分中得出的。过去我称之为秩序,以区别于大五人格中的尽责性。它们相似,但这个因素略显锋芒(例如,严格的、复仇的)。秩序是关于无论如何都要实现自己的目标。大五人格从PC1(PFP)中提取方差,并将其与秩序混合以生成尽责性。因此,严厉与秩序强烈相关,但在尽责性上中立。
在我看来,将实现个人目标的能力与实现社会目标的愿望结合在一起的构念会混淆局势。我认为,IO研究例如,使用秩序比使用尽责性或毅力更好。感兴趣的相关性(如晋升)肯定更直接地与秩序相关。没有见过纯粹的团队合作者能达到顶峰。总是有个人的锋芒。
神秘因素2#
主要词汇:缺乏想象力的、不复杂的、道德的、富有同情心的、有原则的对比狡猾的、奸诈的、机灵的、有创造力的、聪明的
评论者将其描述为:负面开放性、勤勉性和信任言辞。
这个因素更棘手,因为它实际上是用于定义大五人格的经典论文中数据的第六个未旋转成分。这是他们隐藏的东西! 这是未被选中的部分。有趣的是,该数据中的第五和第六因素都与经验开放性有关。当然,从统计上讲,可能有理由将模型限制在五个因素上。但从定性上看,最后一个因素被分成了两个因素,只有一半的信号被包括在内。这更多的是一种奇特现象。不知道在其他数据集中是否成立。
[图片:原文中的视觉内容]435个词汇使用词向量和调查数据进行因子化。第三个未旋转因素从词向量(NLP)中选出,第六个从调查中选出。为了适应这些词汇,仅显示了150/435个。这些是随机选择的,产生了与上次帖子不同的子集。
希望你喜欢这个小练习。在研究生院开发从词向量中提取词汇负载的方法时,我不知道结果是信号还是噪音。起初,更多的是噪音,我花了很多时间阅读词汇负载中的“茶叶”,希望看到一个统一的心理构念。时间紧迫,只有前2-3个NLP因素可以在大五人格中找到,但需要仔细观察。发现大二的情感释放——我可以完美地恢复——是我对它们的偏爱的一部分。这比勉强恢复大五人格的一半更值得写进论文。