De Vectors of Mind - imágenes en el original.
En el episodio de hoy, me acompaña David Stillwell, profesor de ciencias sociales computacionales en la Universidad de Cambridge, quien utiliza big data para entender la psicología.
Me crucé con el Profesor Stillwell hace varios años debido a su innovador trabajo en el conjunto de datos MyPersonality. Consiste en estados de Facebook y datos de personalidad de millones de voluntarios del estudio, que él puso a disposición de los investigadores. Docenas de investigadores lo utilizaron para entender cómo se comportan las personas en línea y qué revela eso sobre otras partes de sus vidas. Su investigación fue influyente en el endurecimiento de las políticas sobre cómo se gestiona la información de los usuarios.
Mi primer artículo como autor principal utilizó este conjunto de datos para predecir la personalidad del Big Five (entre otras cosas) a partir de los estados. Si eso suena familiar, es porque la firma de marketing Cambridge Analytica construyó modelos para hacer lo mismo utilizando un conjunto de datos similar. Afirmaron—falsamente—que esto proporcionaba una ventaja para cambiar la opinión de los votantes. En lugar de leer esto como una fanfarronería de una firma de marketing, los periodistas políticos lo convirtieron en un escándalo internacional. The Guardian rompió la historia: ‘I made Steve Bannon’s psychological warfare tool’: meet the data war whistleblower. Puedes leer su otra cobertura en los convenientemente organizados Cambridge Analytica Files, donde informan que dentro de dos días de la noticia, “casi $60 mil millones fueron borrados de la capitalización de mercado de Facebook.”
Compáralo con cómo The Guardian trató el uso cuestionable de datos de Facebook por parte de Obama:
Obama, Facebook and the power of friendship: Una base de datos informática unificada que recopila y refina información sobre millones de votantes potenciales está a la vanguardia de la tecnología de campaña, y podría ser la clave para una victoria de Obama.
Ha habido muchos buenos reportajes que contrarrestan la desinformación difundida sobre Facebook, Cambridge Analytica y la campaña de Trump. Esta es una oportunidad para escuchar a dos investigadores con un profundo entendimiento de las afirmaciones que se hicieron y cuyos programas de investigación fueron significativamente alterados debido a la cobertura mediática.
Resumen de ChatGPT:
Conjunto de Datos MyPersonality: El conjunto de datos se originó a partir de una aplicación de Facebook creada por Stillwell, que permitía a los usuarios realizar una prueba de personalidad y compartir sus resultados. Esto se convirtió en una rica fuente de datos para la investigación psicológica.
Conexión con Cambridge Analytica: Stillwell aclara que, aunque Cambridge Analytica se inspiró en su investigación, desarrollaron sus propios modelos y datos. Discute los matices de cómo se acercaron a él y su eventual decisión de no colaborar con ellos.
Poder Predictivo de los Datos de Redes Sociales: Tú y Stillwell discuten las capacidades predictivas de los datos de redes sociales, particularmente en el contexto de rasgos de personalidad y otros atributos sensibles. La conversación toca las limitaciones y preocupaciones éticas en torno a esto.
Impacto del Escándalo de Cambridge Analytica: El escándalo tuvo un impacto significativo en la percepción pública y la dirección de tu investigación, desviando el enfoque de los datos de redes sociales debido a su naturaleza controvertida.
Psicología y Modelos Predictivos: Hay una exploración de las limitaciones de los modelos psicológicos como el Big Five para predecir el comportamiento, y cómo el aprendizaje automático y los modelos computacionales podrían ofrecer perspectivas más matizadas.
Direcciones Futuras en la Investigación Psicológica: La discusión se desvía hacia el potencial del lenguaje como una rica fuente de datos para entender la personalidad y el comportamiento, enfatizando la necesidad de un enfoque más detallado que vaya más allá de los modelos tradicionales.
Consideraciones Éticas y Prácticas: La conversación destaca el equilibrio necesario al utilizar big data para obtener conocimientos psicológicos, considerando las implicaciones éticas, las preocupaciones de privacidad y la utilidad real de dicha investigación.