From Vectors of Mind - images at original.


Dans l’épisode d’aujourd’hui, je suis rejoint par David Stillwell, professeur de sciences sociales computationnelles à l’Université de Cambridge, qui utilise les big data pour comprendre la psychologie.

J’ai croisé le chemin du professeur Stillwell il y a plusieurs années en raison de son travail révolutionnaire sur le jeu de données MyPersonality. Il se compose de statuts Facebook et de données de personnalité provenant de millions de volontaires d’étude, qu’il a mis à disposition des chercheurs. Des dizaines de chercheurs l’ont utilisé pour comprendre comment les gens se comportent en ligne et ce que cela révèle sur d’autres aspects de leur vie. Sa recherche a influencé le renforcement des politiques sur la gestion des données des utilisateurs.

Mon premier article en tant que premier auteur a utilisé ce jeu de données pour prédire la personnalité des Big Five (entre autres) à partir des statuts. Si cela vous semble familier, c’est parce que la société de marketing Cambridge Analytica a construit des modèles pour faire de même en utilisant un jeu de données similaire. Ils ont prétendu - à tort - que cela leur donnait un avantage pour changer l’avis des électeurs. Plutôt que de lire cela comme du bluff d’une société de marketing, les journalistes politiques en ont fait un scandale international. The Guardian a révélé l’histoire : ‘J’ai créé l’outil de guerre psychologique de Steve Bannon’ : rencontre avec le lanceur d’alerte de la guerre des données. Vous pouvez lire leurs autres articles dans les Cambridge Analytica Files organisés de manière pratique, où ils rapportent que dans les deux jours suivant la nouvelle, “près de 60 milliards de dollars ont été effacés de la capitalisation boursière de Facebook.”

Comparez cela à la façon dont The Guardian a traité l’utilisation discutable des données Facebook par Obama :

Obama, Facebook et le pouvoir de l’amitié : Une base de données informatique unifiée qui rassemble et affine les informations sur des millions d’électeurs potentiels est à la pointe de la technologie de campagne - et pourrait être la clé d’une victoire d’Obama

Il y a eu beaucoup de bons reportages repoussant la désinformation diffusée sur Facebook, Cambridge Analytica et la campagne Trump. C’est une occasion d’écouter deux chercheurs ayant une compréhension approfondie des affirmations qui ont été faites et dont les programmes de recherche ont été significativement modifiés en raison de la couverture médiatique.

Résumé de ChatGPT :

  1. Jeu de données MyPersonality : Le jeu de données provient d’une application Facebook créée par Stillwell, qui permettait aux utilisateurs de passer un test de personnalité et de partager leurs résultats. Cela est devenu une source riche de données pour la recherche psychologique.

  2. Lien avec Cambridge Analytica : Stillwell clarifie que bien que Cambridge Analytica se soit inspiré de sa recherche, ils ont développé leurs propres modèles et données. Il discute des nuances de leur approche et de sa décision finale de ne pas collaborer avec eux.

  3. Pouvoir prédictif des données des réseaux sociaux : Vous et Stillwell discutez des capacités prédictives des données des réseaux sociaux, en particulier dans le contexte des traits de personnalité et d’autres attributs sensibles. La conversation aborde les limites et les préoccupations éthiques entourant cela.

  4. Impact du scandale Cambridge Analytica : Le scandale a eu un impact significatif sur la perception publique et la direction de votre recherche, déplaçant l’attention loin des données des réseaux sociaux en raison de sa nature controversée.

  5. Psychologie et modèles prédictifs : Il y a une exploration des limites des modèles psychologiques comme les Big Five pour prédire le comportement, et comment l’apprentissage automatique et les modèles computationnels pourraient offrir des perspectives plus nuancées.

  6. Directions futures dans la recherche psychologique : La discussion s’oriente vers le potentiel du langage comme source riche de données pour comprendre la personnalité et le comportement, en soulignant la nécessité d’une approche plus détaillée qui va au-delà des modèles traditionnels.

  7. Considérations éthiques et pratiques : La conversation met en lumière l’équilibre nécessaire dans l’utilisation des big data pour des insights psychologiques, en considérant les implications éthiques, les préoccupations de confidentialité et l’utilité réelle de telles recherches.