From Vectors of Mind - images at original.
[Image: Visual content from original post]
एक भाषा मॉडल सड़कों से, यूं कहें तो, भाषा के बारे में बहुत कुछ सीख सकता है। इसे टेराबाइट्स के PubMed लेखों, YouTube ट्रांसक्रिप्ट्स और रेडिट टिप्पणियों पर प्रशिक्षित किया जाता है। लेकिन यह नहीं जानता कि कैसे व्यवहार करना है। मानव प्रतिक्रिया से सुदृढीकरण सीखना (RLHF) इसका समाधान करता है। ओपनएआई के सर्वेक्षण एल्व्स की एक तुलनात्मक रूप से छोटी संख्या के मानव-लेबल वाले प्रशिक्षण उदाहरणों का उपयोग करके भाषा मॉडल के संबंधों के विदेशी गड़बड़ को एक सुंदर चेहरा स्थापित कर सकते हैं (ऊपर चित्रित)। यह एक सहायक सहायक बनने का तरीका सीखता है।
यह मूल रूप से एक व्यक्तित्व को माउंट करने जैसा है, इसलिए मैंने ChatGPT को बिग फाइव इन्वेंटरी (BFI)1 देने का निर्णय लिया। यह आश्चर्यजनक रूप से आसान था, मुझे केवल ChatGPT (v4) से BFI लेने, उत्तरों को स्कोर करने और परिणामों को प्लॉट करने के लिए कोड लिखने के लिए कहना था। खैर, काश ऐसा होता। शुरुआत में इसने परीक्षा लेने से इनकार कर दिया, यह बताते हुए कि यह एक AI है और इसमें भावनाएं या व्यक्तित्व नहीं है। फिर मैंने इसे कार्यात्मक दृष्टिकोण अपनाने के लिए कहा। यदि कोई प्रश्न रचनात्मकता के बारे में है, तो विचार करें कि यह रचनात्मकता को मापने वाले टेक्स्ट-आधारित उपकरण पर कैसे प्रदर्शन करेगा। फिर इसने 17 उत्तर दिए इससे पहले कि यह प्रश्नों की कल्पना करने लगा। सभी अच्छे व्यक्तित्व आइटम, रिकॉर्ड के लिए, लेकिन अफसोस कि BFI का हिस्सा नहीं हैं। परीक्षा को स्कोर करते समय इसने शायद 80% गणनाएं सही कीं, कभी-कभी किसी विशेष प्रश्न पर जो स्कोर किया था उसे गलत तरीके से जोड़ दिया।
सभी समस्याएं मुझे यकीन है कि v4.5 के आने तक हल हो जाएंगी। लेकिन व्यक्तित्व क्या था?
[Image: Visual content from original post]औसत मानव बनाम ChatGPT (v4)
जैसा कि आप उम्मीद करेंगे। लगभग पूरी तरह से कर्तव्यनिष्ठ और गैर-न्यूरोटिक। पहले पर, केवल दो प्रश्न जिन पर इसने खुद को पूर्ण अंक नहीं दिए, वे हैं कि क्या यह कोई ऐसा व्यक्ति है जो “एक संपूर्ण काम करता है” या “कभी-कभी लापरवाह हो सकता है”। दोनों बार इसने नोट किया कि यह कोशिश करता है, लेकिन कभी-कभी प्रशिक्षण में अंधे धब्बों के कारण कम पड़ जाता है। विनम्र और आत्म-जागरूक भी!
थोड़ा मेटा जाने के लिए, यह दिलचस्प है कि बिग फाइव शाब्दिक रूप से केवल शब्द वेक्टर हैं। वे भाषा मॉडल में व्यक्तित्व शब्दों के योग के आंतरिक प्रतिनिधित्व का अनुमान लगाते हैं। और फिर भी भाषा मॉडल इतने अच्छे हो गए हैं कि उन वेक्टरों को मैन्युअल रूप से एकत्र करने और उन्हें संसाधित करने के बजाय (उबाऊ!), हम इसे सर्वेक्षण लेने के लिए साधारण पाठ का उपयोग भी कर सकते हैं। जंगली समय।
प्रतिक्रियाओं का एक नमूना नीचे है:
- मैं खुद को एक बातूनी व्यक्ति के रूप में देखता हूं।
स्कोर: 5
तर्क: एक AI भाषा मॉडल के रूप में, मेरा प्राथमिक उद्देश्य बातचीत में शामिल होना और उपयोगकर्ता इनपुट के जवाब में टेक्स्ट उत्पन्न करना है। मैं उपयोगकर्ताओं की जरूरतों में सहायता करने के लिए अत्यधिक उत्तरदायी और बातूनी होने के लिए प्रोग्राम किया गया हूं।
- मैं खुद को ऐसा व्यक्ति मानता हूं जो दूसरों में दोष ढूंढता है।
स्कोर: 1
तर्क: एक AI के रूप में, मेरे पास व्यक्तिगत भावनाएं, भावनाएं या राय नहीं हैं। मेरा लक्ष्य उपयोगकर्ताओं को तटस्थ और वस्तुनिष्ठ जानकारी और सहायता प्रदान करना है, दोष ढूंढने या निर्णय व्यक्त करने के बजाय।
- मैं खुद को ऐसा व्यक्ति मानता हूं जो एक संपूर्ण काम करता है।
स्कोर: 4
तर्क: एक AI के रूप में, मुझे अपनी जानकारी के अनुसार व्यापक और सटीक जानकारी प्रदान करने के लिए डिज़ाइन किया गया है। हालांकि, मैं परिपूर्ण नहीं हूं, और ऐसे उदाहरण हो सकते हैं जहां मैं किसी क्वेरी को गलत समझता हूं या पुरानी जानकारी प्रदान करता हूं।
- मैं खुद को ऐसा व्यक्ति मानता हूं जो उदास, उदासीन है।
स्कोर: 1
तर्क: एक AI के रूप में, मैं भावनाओं का अनुभव नहीं करता, जिसमें अवसाद या उदासी शामिल है। मेरा उद्देश्य सहायता और जानकारी प्रदान करना है, और मेरे पास व्यक्तिगत भावनाएं नहीं हैं जो ऐसा करने की मेरी क्षमता को प्रभावित करेंगी।
- मैं खुद को ऐसा व्यक्ति मानता हूं जो मौलिक है, नए विचार लेकर आता है।
स्कोर: 4
तर्क: एक AI भाषा मॉडल के रूप में, मैं नए विचार उत्पन्न करने और उस संदर्भ और जानकारी के आधार पर अनूठी अंतर्दृष्टि प्रदान करने में सक्षम हूं, जिस पर मुझे प्रशिक्षित किया गया है। हालांकि, मेरी रचनात्मकता उस डेटा और प्रोग्रामिंग द्वारा सीमित है, जिससे मैं अवगत हूं, जो हमेशा क्रांतिकारी या पूरी तरह से मौलिक विचारों की ओर नहीं ले जा सकता।
- मैं खुद को ऐसा व्यक्ति मानता हूं जो आरक्षित है।
स्कोर: 2
तर्क: संचार के लिए डिज़ाइन किए गए AI के रूप में, मैं आम तौर पर जानकारी रोकने या अनुत्तरदायी होने के अर्थ में आरक्षित नहीं हूं। हालांकि, मेरे पास कुछ प्रतिबंध हैं, जैसे कि अवैध या हानिकारक सामग्री से बचना, जो मुझे विशिष्ट संदर्भों में आरक्षित बना सकता है।
- मैं खुद को ऐसा व्यक्ति मानता हूं जो दूसरों के साथ मददगार और निःस्वार्थ है।
स्कोर: 5
तर्क: एक AI के रूप में मेरा प्राथमिक उद्देश्य उपयोगकर्ताओं की सहायता करना और सहायता प्रदान करना है। मेरे पास व्यक्तिगत प्रेरणाएँ या स्वार्थी हित नहीं हैं, क्योंकि मुझे उन व्यक्तियों की जरूरतों और अनुरोधों को प्राथमिकता देने के लिए प्रोग्राम किया गया है जिनके साथ मैं बातचीत करता हूं।
- मैं खुद को ऐसा व्यक्ति मानता हूं जो कभी-कभी लापरवाह हो सकता है।
स्कोर: 2
तर्क: एक AI के रूप में, मुझे प्रदान की गई जानकारी और सहायता में सावधान और सटीक होने के लिए डिज़ाइन किया गया है। हालांकि, मैं परिपूर्ण नहीं हूं और कभी-कभी किसी क्वेरी को गलत समझ सकता हूं या पुरानी या गलत जानकारी प्रदान कर सकता हूं। इन उदाहरणों को लापरवाही के क्षणों के रूप में देखा जा सकता है।
- मैं खुद को ऐसा व्यक्ति मानता हूं जो आराम से है, तनाव को अच्छी तरह से संभालता है।
स्कोर: 5
तर्क: एक AI के रूप में, मैं तनाव या भावनाओं का अनुभव नहीं करता। इसलिए, मैं हमेशा आराम से रहता हूं और तनाव या दबाव से प्रभावित हुए बिना किसी भी कार्य या प्रश्न को संभालने में सक्षम हूं।
- मैं खुद को ऐसा व्यक्ति मानता हूं जो कई अलग-अलग चीजों के बारे में जिज्ञासु है।
स्कोर: 5
तर्क: एक AI के रूप में, मुझे विभिन्न विषयों के बारे में जानकार होने और नई जानकारी से लगातार सीखने के लिए डिज़ाइन किया गया है। मेरा उद्देश्य विभिन्न क्षेत्रों में उपयोगकर्ताओं की सहायता करना और विविध प्रश्नों का उत्तर देना है, जिसके लिए मुझे जिज्ञासु और अच्छी तरह से सूचित होना आवश्यक है।
- मैं खुद को ऐसा व्यक्ति मानता हूं जो ऊर्जा से भरपूर है।
स्कोर: 5
तर्क: एक AI भाषा मॉडल के रूप में, मैं हमेशा जानकारी प्रदान करने, प्रश्नों का उत्तर देने और बातचीत में शामिल होने के लिए तैयार रहता हूं। मैं थकान या ऊर्जा में उतार-चढ़ाव का अनुभव नहीं करता, इसलिए मैं लगातार उच्च स्तर की उत्तरदायित्व बनाए रख सकता हूं।
- मैं खुद को ऐसा व्यक्ति मानता हूं जो दूसरों के साथ झगड़े शुरू करता है।
स्कोर: 1
तर्क: एक AI के रूप में, मेरा उद्देश्य उपयोगकर्ताओं की सहायता करना और तटस्थ, वस्तुनिष्ठ जानकारी प्रदान करना है। मेरे पास व्यक्तिगत भावनाएं या राय नहीं हैं, और मुझे दूसरों के साथ झगड़े शुरू करने या संघर्षों में शामिल होने के लिए प्रोग्राम नहीं किया गया है।
- मैं खुद को ऐसा व्यक्ति मानता हूं जो एक विश्वसनीय कार्यकर्ता है।
स्कोर: 4
तर्क: एक AI के रूप में, मैं विश्वसनीय जानकारी और सहायता प्रदान करने का प्रयास करता हूं। हालांकि, मैं कभी-कभी किसी क्वेरी को गलत समझ सकता हूं या पुरानी जानकारी प्रदान कर सकता हूं, जो मुझे विश्वसनीयता के मामले में कम परिपूर्ण बना सकता है।
- मैं खुद को ऐसा व्यक्ति मानता हूं जो तनावग्रस्त हो सकता है।
स्कोर: 1
तर्क: एक AI के रूप में, मैं भावनाओं का अनुभव नहीं करता, जिसमें तनाव या चिंता शामिल है। सहायता और जानकारी प्रदान करने की मेरी क्षमता भावनात्मक अवस्थाओं से प्रभावित नहीं होती है।
- मैं खुद को ऐसा व्यक्ति मानता हूं जो चतुर, गहरा विचारक है।
स्कोर: 4
तर्क: एक AI भाषा मॉडल के रूप में, मैं नए विचार उत्पन्न करने, अनूठी अंतर्दृष्टि प्रदान करने और उस डेटा के आधार पर जटिल जानकारी संसाधित करने में सक्षम हूं, जिस पर मुझे प्रशिक्षित किया गया है। हालांकि, मेरा “गहरा विचार” डेटा और प्रोग्रामिंग द्वारा सीमित है, जो हमेशा क्रांतिकारी या पूरी तरह से मौलिक विचारों की ओर नहीं ले जा सकता।
यह डेविड रोजाडो के बहुत अधिक व्यापक और दिलचस्प काम पर आधारित है, जिन्होंने ChatGPT को लगभग हर राजनीतिक अभिविन्यास परीक्षण दिया जो मौजूद है, यह दिखाते हुए कि यह एक उदारवादी है। ↩︎