From Vectors of Mind - images at original.
[Image: Visual content from original post]
“初めに言葉があった。そして言葉は心理学と共にあり、言葉は心理学であった” ~新しいベクトル翻訳
すべてのパーソナリティ構造は、まず言葉によって記述されます。フロイトのコカインに影響されたモデルから、堅実なビッグファイブまで、すべてはある時点で言葉です。学術心理学の多くは、構造を比較することに関心があります。これを行うには、通常は一連の被験者を共有する必要があります。被験者は、構造空間における自分の位置を近似するための手段(通常は調査)を与えられます。被験者の回答がどのように共変するかに基づいて、構造についての一般的な主張がなされます。この投稿では、別の方法を探ります。NLPの進歩により、構造をその自然な生息地である言語で定量的に比較することが可能になりました。
ロードマップ#
前回の投稿では、ビッグファイブが単語ベクトルであると主張しました。この投稿では、独立した尺度についても同様の主張を行い、それにより被験者を関与させずに構造を比較することが可能になります。これを示すために、広範なパーソナリティモデルと、構造を単語空間で表現する方法を紹介します。概要は次のとおりです:
被験者空間と単語空間での構造の比較
被験者空間の問題
被験者を使用してビッグファイブに親族と互恵的利他主義を関連付ける
単語空間での同じ比較
NLPを使用して特定された(仮の)5因子モデルを紹介
その空間に利他主義の単語を投影
コードはこちらで利用可能。
議論、限界、今後の課題
曲がりくねった道#
利他主義をビッグファイブと比較するには、多くの変換を経る必要があります:利他主義(理想)→言葉で記述→この構造を近似するための調査が開発され(そしておそらく検証され)→これを解釈し、内省する被験者に実施→被験者の利他主義スコア→被験者空間での相関←被験者のビッグファイブインベントリ(BFI)スコア←被験者がBFI項目を解釈し、内省←BFIを開発してこれをおおよそ測定←定性的な記述によって定義/伝達された構造←単語の負荷によって定義されたビッグファイブ。次に、利他主義とビッグファイブという2つの理想についての主張がなされます。
まっすぐで狭い道#
なぜ被験者の代わりに単語ベクトルを共通の基盤として使用しないのでしょうか?この道ははるかに直接的です:利他主義(理想)→言葉で記述→単語空間にベクトル化→単語空間での比較←ビッグファイブ、これはすでに単語空間に存在します。前回の投稿で議論したように。スコアをつけると、それは4対10の変換です。(ゴルフのようにスコアがつけられます。)
[Image: Visual content from original post]心理学の分野を訪れる統計的現実。ここ数年は厳しいものでした。
啓示者タル#
言語的構造についての主張をするために被験者を使用することの難しさは秘密ではありません。
“心理学におけるほとんどの理論と仮説は言語的な性質を持っていますが、それらの評価は圧倒的に推論統計手法に依存しています。質的から量的分析への移行の妥当性は、仮説の言語的および統計的表現が密接に一致していることに依存しています。ここでは、心理学における統計的推論の多くの応用がこの基本条件を満たしていないと主張します。” ~Tal Yarkoni, 一般化可能性の危機
ここでの妥当性とは、測定しようとする構造を捉えるスコアを指します。議論と例を完全に読む価値があります。しかし、私たちにとっての教訓は、これらの現実を考慮した上で何ができるかです。彼は次のことを提案しています:
別のことをする(他の分野に入る)。
質的研究を受け入れる
より良い基準を採用する(7つの提案を含む)。
“小さなp値を得た狭い統計的操作化が、複雑な心理学的構造についての広範な言語的推論のための適切な基盤を提供できると見せかけることは常に自由ですが、他の誰も—仲間も、資金提供者も、公衆も、そして長期的な科学的記録も—その茶番を尊重する義務はありません。”
心理学の研究に対する見方がそれほど暗くなくても、読者は主張をするが実験がかろうじて関連している論文に焼かれた経験があるでしょう。利用可能な解決策はすべて痛みを伴います。分野はより狭い視点を採用し、歴史、文学、線形代数を研究する人々に大きな問題を任せる必要があるかもしれません。私は別の前進の方法を提案します。
単語空間への変換。4. 単語ベクトルを共通の基盤として使用する#
構造は単語空間で共存していますが、比較が行われるときには被験者空間に引きずり込まれます。これは巨大で、損失が多く、面倒です。もし彼らが安全に単語空間に留まることができたらどうでしょうか?自然言語処理の概念は、単語が連続空間のベクトルであるということです。これらのベクトルを分析することは、負荷 ベアリング プロセスとして数兆ドルの産業で十分に機能し、現在心理学に再導入されています。
説教することを実践する#
ここでは、被験者空間で行われた伝統的な研究を見て、それを単語空間に移動することで改善しようとします。ストローマンに対抗するために、対象は親族利他主義、互恵的利他主義、ビッグファイブパーソナリティ因子であり、これは何百回も引用され、最初の著者はh指数70を持っています。
被験者は3つの手段を使用して測定されます:ビッグファイブ(形容詞の調査を通じて)、共感/アタッチメントと許し/非報復(フレーズの調査)、およびお金を分配するゲームでの利他主義。著者は、同意性と感情的安定性(別名神経症傾向)の間の中間空間が2つの利他主義を区別すると仮定しているため、その領域をよりよく測定するためにいくつかの単語が追加されます。同様に、共感/アタッチメントと許し/非報復を測定するための新しい質問票が設計されており、これらはそれぞれ親族対互恵的利他主義に関連していると理論付けられています。この種の研究に対しては、ゲームが利他主義を測定するために使用されます。
“親族利他主義を測定するために使用された金銭配分タスクのバージョンでは、他の人は親しい友人として説明されました—参加者が長い友情の歴史を持ち、共通点が多い人です。友情を古いものとして説明し、友人を参加者と非常に似ている人として説明することで、友情が親族との関係に非常に似ていることを望んでいました。利他主義の潜在的な対象として親族を使用しなかった理由は、特定の親族に対する反応の分散を導入することを避けるためでした。たとえば、多くの人々はある兄弟に対して他の兄弟よりも利他的に行動することをいとわないかもしれません。”
言い換えれば、親族に対する現実世界の感情でデータを汚さないように、互恵的利他主義が測定されます。
“互恵的利他主義を測定するために使用された金銭配分タスクのバージョンでは、他の人は非協力者として説明されました—参加者に対して失礼で、意地悪で、思いやりのない人です。”
そして、互恵的利他主義を測定するために、彼らは…非互恵的利他主義を測定しますか?当然、相関関係があり、著者は次のように結論付けます:
“この研究の結果は、共感とアタッチメントを含むパーソナリティ特性が主に親族に向けられた利他主義(すなわち、親族利他主義)を促進し、許しと非報復を含むパーソナリティ特性が主に非親族に向けられた利他主義(すなわち、互恵的利他主義)を促進するという提案を支持しています。”
しかし、互恵的利他主義が測定されていない場合、どのようにして結果がその主張を支持するのでしょうか?Talが指摘するように、心理学論文の統計はしばしば修辞的な飾りです。しかし、私たちはそれに従う必要はありません!単語空間が何を言っているか見てみましょう。
ミルクとハチミツの地(単語空間へようこそ)#
伝統的な研究では、被験者をパーソナリティ空間にマッピングするコストのために、解像度は一度にいくつかのパーソナリティ領域でしか高くできません。これが、著者が共感と非報復、同意性と感情的安定性の間の空間を調査した理由です。これらの軸はすべて通常のビッグファイブ空間に存在します、しかし非常に詳細に測定されています。単語空間では、利他主義を完全なビッグファイブとその高解像度の栄光で比較できます。私のgithubには、2819の単語ベクトルが5つのPCに因子化されています。これらを便利に使用できます。最初の仕事は、各利他主義を説明する単語セットを選択することです。親族の単語として、家族の役割を体現するものを選びました:brotherly, sisterly, mothering, motherly, fatherly, grandmotherly, grandfatherly, wifely, maternal, paternal. 互恵的利他主義については、Triversの定義に従います。
_“人間の互恵的利他主義に関しては、この利他主義を調整する心理的システムの詳細がモデルによって説明できることが示されています。具体的には、友情、嫌悪、道徳的攻撃、感謝、同情、信頼、疑い、信頼性、罪悪感の側面、そしていくつかの不正直さと偽善の形態が利他主義システムを調整するための重要な適応として説明できます。各個人は、利他的および欺瞞的傾向を持っていると見なされ、その表現は、選択された発達変数に敏感であり、地元の社会的および生態学的環境に適したバランスに設定されます。” _互恵的利他主義の進化, Robert Trivers(太字は追加)
これを考慮して、次の単語を選びました:discriminating, unforgiving, vengeful, loyal, neighborly, cooperative, trustworthy, および fair. これは、協力に向けて誤ったり、物事がうまくいかないときに道徳的攻撃でフォローアップすることを意味します。さらに、これはこの利他主義を欺瞞の対極として捉えようとしています(例:fair , trustworthy)。
(信頼の進化についての優れた説明については、こちらのインタラクティブデモをご覧ください。)
未知の5因子モデルをご紹介しますか?#
理論的には、調査を通じて生成されたビッグファイブの単語負荷を使用することができますが、これらの単語の多くは含まれていないほど珍しいです。これは、心理学の学生による自己報告で_grandmotherly_を良い推定値として得ることができないため、最善です。そのため、言語モデルRoBERTaを使用して計算された単語ベクトル。大規模でよく特徴付けられたパーソナリティ単語のリストから派生した結果、5つの因子は簡単に言うと次のとおりです:
アフィリエーション(または社会化)。この人をチームに迎えたいかどうか。Agreeablenessに似ていますが、ドアマットになることを除外します。たとえば、_Gullible_はアフィリエーションに中立的に負荷しますが、Agreeablenessには正の負荷があります。
ダイナミズム。冒険心に関するもので、自信よりも冒険心に近い。
オーダー。Conscientiousnessにエッジがあり、自分の目標を達成する能力。Exacting_対_mushy。
感情的アタッチメント。Neuroticismが不安定性に関するものであるのに対し、これはアタッチメントに関するものです。_caring_と_spiteful_の両方が高く負荷されます。
超越。_unique, complicated, star-crossed, handicapped, mystical, heartbroken, other-worldly_対_unphilosophical, fancy-free, pigheaded, boorish, materialistic, self-centered, glib_で特徴付けられる因子です。自己と日常を超えたものを見ることに関与しています。そのプロセスは、どうやら痛みと絡み合っています。実際、「troubled」は超越よりも感情的アタッチメント(Neuroticismに関連する因子)に多く負荷されます。
最初の3つの因子の名前は、De Raadのパン文化的研究から借用されています。質的には、ビッグファイブよりも一致しています。各因子は独自の投稿に値します。(産業心理学に携わる方々には、オーダーがConscientiousnessよりもビジネスの成功と相関していると疑っています。時間通りに現れるよりも計算的です。)しかし、モデルを提案することは私の得意分野ではなく、より細かい言語研究が進行中であり、異なる構造をもたらすかもしれません。今のところ、これらの因子で十分です。ビッグファイブとの相関は次のとおりです:
[Image: Visual content from original post]
結果#
利他主義の単語負荷は最初の4つの因子にあります(超越はこの研究では重要ではありません):
[Image: Visual content from original post]強い家族の絆を持つことは社会的に有益ですが、少し退屈です(ダイナミズムは中立から低い)。すべての単語は似た場所にマッピングされます。
[Image: Visual content from original post]家族の単語は感情的アタッチメントに強く負荷されます。親と祖父母の関係は非常に性別に偏っています。Triversの親の投資理論が予測し、統計が証明するように、男性は女性よりもアタッチメントが少ないです。しかし、兄弟と姉妹は同等にアタッチされ、親よりも少し低いです。考えてみると、_wifely_は血縁者に関する利他主義に含まれるべきではありません。昼間のトークショーと一致して、母親や祖母よりもアタッチメントが少ないです。
[Image: Visual content from original post]互恵的な単語は、パートナーが協力しているか欺いているかに応じて理想的な行動を捉えようとします。そのため、これらの単語ははるかに広がっていますが、それでもほとんどがポジティブです。‘discriminating’でさえわずかにポジティブであり、単語が’人種差別的’のように解釈されていないことを意味します—時々これらの言語は音韻的な類似性で混乱します(例:eccentricとethnocentric)。
[Image: Visual content from original post]協力と隣人愛は、自己の目標が後回しにされることをわずかに示唆します。許さないことと差別することは、ビジネスを意味する人々のためです。
利他主義を比較するために、これらの単語セットを1つのベクトルに縮小したいです。(それが意味をなすかどうかについては議論の余地がありますが、互恵的—そしてある程度親族—は異なるシナリオに異なる反応を必要とします。)安価で簡単な解決策は、各構造を単語の袋として扱い、平均を取ることです。平均負荷は次のとおりです:
[Image: Visual content from original post]これらは2819の単語に対してzスコア化されています。平均して、親族の単語はアフィリエーションと感情的アタッチメントの両方で1-1.5 SD外れています。
[Image: Visual content from original post]互恵的利他主義もまた、自己の目標を達成することを含みます。
[Image: Visual content from original post]差:親族マイナス互恵的負荷。オーダーによって支配されています。
議論#
被験者空間の論文には、親族または互恵的利他主義の有効な測定が含まれておらず、それがパーソナリティとどのように関連しているかについての理解を深めるものではないと思います。これは驚くほど一般的な失敗モードです。単語空間は無効な比較に対する保険を提供します。私たちは、単語が単語空間でどこにあるべきかについての直感を、調査に回答する被験者112がどのように答えるべきかよりも持っています。エラーを見つけるのが簡単です。
ベイズ的な観点から見ると、被験者空間と単語空間では異なることが起こっています。被験者を含む実験は、新しい情報をテーブルに持ち込むことを目指しています。読者の世界観を更新することを期待しています。しかし、研究者(および一般の人々)は多くの社会的経験を持ち、調査が提供するスナップショットよりも心理的プロセスをより鋭く認識しています。針を大きく動かすのは難しいです。単語空間は、新しい知識を生み出すというよりも、私たちの事前知識を視覚化することに似ています。この視点は価値があります。なぜなら、言語は言わば、現実と接する場所だからです。JLオースティンが言ったように:
“私たちの共通の単語のストックは、多くの世代の間に人々が引く価値があると見なしたすべての区別と、価値があると見なしたすべての接続を具現化しています:これらは確かに、午後のアームチェアであなたや私が考え出す可能性があるものよりも、より多く、より健全で、より微妙である可能性が高いです—最もお気に入りの代替方法。”弁解のための嘆願_
単語空間での分析は比較的簡単です。相関とp値の表の代わりに、単語は単に関心のある軸にプロットされ、視覚的な判断が行われます。親族利他主義の単語は、アフィリエーションと感情的アタッチメントの両方で密集しています。父親は兄弟ではなく、女性の対応者よりもアタッチメントが少なく、Triversの親の投資理論と一致しています。兄弟と姉妹は兄弟を世話する理由があります。しかし、父親は母親よりも理由が少ないです。精子は安いです。卵と妊娠は高価です。
互恵的な単語は、パートナーの協力または裏切りに対する理想的な反応を反映して、より広がっています。最も顕著な違いは、自己の目標を達成するためのオーダーの平均負荷が高いことです。最初は_遅延リターン利他主義_と呼ばれた互恵的利他主義は、見知らぬ人のために自己を犠牲にすることではなく、社会的手段を通じて自分の将来に投資することです。一方、親族利他主義は、自己の犠牲を払ってでも家族を助けることを指し、利己的な遺伝子が心のひもを引っ張ります。これは、Ashtonの仮説を支持する感情的アタッチメントの親族利他主義の単語の高い負荷に現れています。しかし、主なアクションはオーダーにあり、被験者空間の手段が検出するように設計されていた場所から遠く離れています。被験者空間でのサンプリングのコストは、研究者の事前知識に結果をより依存させます。
これらのプロットを解釈することは、茶葉を読むように感じることがありますが、私はここにあるものについて約70%の確信があります。私を躊躇させる一つのことは、2つの利他主義が異なる方法で表現されていることです。親族の単語はすべて関係を説明します(例:母、父、兄弟)、一方、互恵的な単語は関係(例:隣人)と繰り返しの正の合計ゲームに適した特性(例:復讐心、差別的、協力的)の混合です。不確実性はさておき、午後に何百万もの人々の生きた利他主義の経験を組み合わせた実験を行ったらクールではないでしょうか?世代が父親的、姉妹的、または隣人的とすることに同意したもの。信号の新しい情報源があるときはいつでも、直感的に始めます。最終的に、ワイルドウェストは飼いならされ、方法とヒューリスティックが現れます。改善の余地はたくさんあります。読者は単語セットを調整し、このcolabノートブックを使用して数分で新しい結果を得ることができます。ぜひお試しください!
単語空間の利点#
レキシカル仮説に接続されています。分散型の社会的現実に基づいています。
変換が少ない。各ステップは損失が多く、バイアスを導入します。
単語空間への変換後は統計的に集中的ではありません。(参入障壁が低い。)
有効なサンプルサイズ(redditのコメント、書籍の執筆、またはpubMedの記事を通じて言語モデルに貢献した人々)は、ほとんどの研究よりもはるかに大きく多様です。
NLPを知っている心理学の博士号取得者のためのより良い就職機会。
多言語/多文化の作業が容易です。いくつかのモデルは100の言語で同時にトレーニングされています(これはMetaがヘイトスピーチフィルターを少ない例でトレーニングする方法です)。
オープンサイエンス。
欠点#
動く部分が多い。言語モデルには数十億のパラメータがあります!しかし、数十億のニューロンと数十のトレーニング決定でも安定した表現を生み出すことができます。価値のある言語モデルは、「夫は妻に対して王は____に対して」という類推を完了できます。
結果を人口統計で分解することはできません。時には、25〜30歳の小学校教師のパーソナリティを知ることが興味深いことがあります。または、ある構造が逮捕記録とどのように相関しているかを知ることが興味深いことがあります。単語空間では不可能です。
言語モデルはバイアスがあるのではないですか?まあ、自己報告よりはバイアスがありません。
利他主義を多くの単語ベクトルの合計として定義すること(つまり、単語の袋)は少しハッキーです。ここには大幅な改善の余地があります。
[Image: Visual content from original post]被験者空間を40年間さまようことに満足している心理学者。
異国の神々#
“カフカが、現代人にとって国家官僚制が神聖な次元との唯一の接触であると言ったとき、彼は正しかったと思います。” ~ジジェク、イデオロギーのペルバートガイド
彼はここで、もちろん、IRBに対する上訴を提出する超越的な感覚を説明しています。私は予測を持っています。単語空間は信号処理の観点から見て良いことであり正しいことですが、その採用は規制されていないという便利さによっても駆動されるでしょう。その結果、IRBは言語モデルを最初に宣言する政府機関になるでしょう。
[Image: Visual content from original post]John spreading the good word space
道を整える#
我々は言語モデルから構造間の関係を抽出したいと考えています。これをノイズを増やすのではなく、シグナルを追加する方法で行うには、多くの検証作業が必要です。最初は、確立された調査結果と比較することを意味します。単語ベクトルを使用してそれらを再現できるでしょうか?どこで失敗するのでしょうか?それが確立されたら、「さらなる研究が必要」と結論付けるすべての論文は、単語空間で質問をする方法を見つけるべきです。
私は、当時の最先端モデルであるRoBERTaからパーソナリティ関係を抽出する方法を微調整するのに1年以上を費やしました。その後すぐにGPT-3がリリースされ、すぐにより良いパフォーマンスを発揮しました。計算能力がドメイン知識を超えることは、AIにおける繰り返される苦い教訓です。計算能力は指数関数的に増加します。ドメイン知識を使用して一般的なMLソリューションに対して30%の向上を得ることができるなら、計算能力が追いつくのを待って、一般的な方法を使用して同じ結果を得ることもできます。心理学の質問を市販のNLPモデルに関連付ける方法を見つけることは、したがって良い進展です。目に見えて性能が向上した新しいモデルが約6か月ごとに公開されます。単語空間を検証する人々は、より大きな知性—PaLM、GPT-7、OSCar(O ptimal S entience Car tography)—が心理学的真実を降らせるための道を整えています。
自然言語は世界についての共有理論で溢れています。今やそれらを定量化できるようになったのですから、証拠として使えないでしょうか?
これが興味深いと思ったら、ぜひシェアしてください!