摘自 Vectors of Mind —— 图片见原文。


在今天这一期节目中,我邀请到了 David Stillwell,他是剑桥大学的计算社会科学教授,利用大数据来理解心理学。

几年前,我因为他在 MyPersonality 数据集上的开创性工作而与 Stillwell 教授结缘。该数据集由数百万研究志愿者的 Facebook 状态更新和人格数据组成,他将其开放给研究者使用。数十位研究者利用它来理解人们在网络上的行为,以及这些行为揭示了他们生活中其他方面的情况。他的研究在收紧用户数据管理政策方面具有重要影响。

我的第一篇第一作者论文就使用了这个数据集,从状态更新中预测大五人格(以及其他内容)。如果这听起来很熟悉,那是因为营销公司 Cambridge Analytica 使用类似的数据集构建了做同样事情的模型。他们声称——错误地——这为改变选民想法提供了优势。政治记者没有把这当作一家营销公司的夸大宣传,而是将其炒作成一场国际丑闻。《卫报》首先披露了这一事件:‘I made Steve Bannon’s psychological warfare tool’: meet the data war whistleblower你可以在他们方便整理好的 Cambridge Analytica Files 中阅读其他报道,在那里他们报道,在新闻曝光后的两天内,“Facebook 的市值蒸发了近 600 亿美元。”

将此与《卫报》对奥巴马可疑使用 Facebook 数据的报道方式进行比较:

Obama, Facebook and the power of friendship:一个统一的计算机数据库,汇集并精炼了数百万潜在选民的信息,处在竞选技术的最前沿——并且可能是奥巴马获胜的关键

关于 Facebook、Cambridge Analytica 和特朗普竞选团队之间传播的错误信息,已经有大量高质量报道进行了反驳。这是一个机会,让你聆听两位对这些主张有深刻理解、且其研究计划因媒体报道而发生重大改变的研究者的看法。

ChatGPT 总结:

  1. MyPersonality 数据集:该数据集源自 Stillwell 创建的一个 Facebook 应用,用户可以通过该应用进行人格测试并分享结果。这成为心理学研究的一个丰富数据来源。

  2. 与 Cambridge Analytica 的关联:Stillwell 澄清,尽管 Cambridge Analytica 受到了他研究的启发,但他们开发了自己的模型和数据。他讨论了他们如何与他接触,以及他最终决定不与其合作的细节。

  3. 社交媒体数据的预测能力:你和 Stillwell 讨论了社交媒体数据在预测人格特质及其他敏感属性方面的能力。对话也涉及了这种预测的局限性和相关伦理问题。

  4. Cambridge Analytica 丑闻的影响:这场丑闻对公众认知以及你们研究方向产生了重大影响,使研究重点因其争议性而从社交媒体数据上转移开来。

  5. 心理学与预测模型:讨论探讨了大五人格等心理学模型在预测行为方面的局限性,以及机器学习和计算模型如何可能提供更细致入微的洞见。

  6. 心理学研究的未来方向:讨论转向语言作为理解人格和行为的丰富数据源的潜力,强调需要超越传统模型,采用更精细化的方法。

  7. 伦理与实践考量:对话强调,在利用大数据获取心理学洞见时,需要在伦理影响、隐私问题和研究的现实效用之间取得平衡。