बर्मिंघम विश्वविद्यालय के एक नए अध्ययन से पता चलता है कि एआई भाषा प्रणालियों में सुधार की कुंजी बड़ी मात्रा में डेटा एकत्र करने में नहीं है, बल्कि मानव भाषा की विविधता का बेहतर प्रतिनिधित्व करने में है। 13 जनवरी को फ्रंटियर्स इन एआई में प्रकाशित शोध का प्रस्ताव है कि यह समझना कि विभिन्न सामाजिक समूहों और संदर्भों में भाषा कैसे भिन्न होती है, एआई विकसित करने के लिए महत्वपूर्ण है जो सभी के लिए अच्छा काम करता है।
मुख्य लेखक प्रोफेसर जैक ग्रीव ने कहा, “जब संकेत दिया जाता है, तो चैटजीपीटी जैसे जेनेरिक एआई कुछ जातीयताओं और लिंगों के बारे में नकारात्मक चित्रण उत्पन्न करने की अधिक संभावना रखते हैं।” “यदि प्रशिक्षण कोष में कुछ सामाजिक समूहों के बारे में हानिकारक या गलत विचारों की अपेक्षाकृत लगातार अभिव्यक्ति होती है, तो एलएलएम अनिवार्य रूप से उन पूर्वाग्रहों को पुन: उत्पन्न करेगा जिसके परिणामस्वरूप संभावित नस्लवादी या लिंगवादी सामग्री होगी।”
मात्रा से अधिक गुणवत्ता
जबकि कंपनियों ने बड़ी मात्रा में टेक्स्ट डेटा पर एआई सिस्टम को प्रशिक्षित करने पर ध्यान केंद्रित किया है, शोधकर्ताओं का तर्क है कि जो अधिक महत्वपूर्ण है वह यह सुनिश्चित करना है कि यह डेटा समाज में उपयोग की जाने वाली भाषा किस्मों की पूरी श्रृंखला का सही ढंग से प्रतिनिधित्व करता है – विभिन्न क्षेत्रीय बोलियों से लेकर पेशेवर शब्दजाल से लेकर पीढ़ीगत अंतर तक। भाषण।
अध्ययन से पता चलता है कि भाषाई विविधता को प्रतिबिंबित करने के लिए सावधानीपूर्वक प्रशिक्षण डेटा का चयन करने से मौजूदा एआई सिस्टम के साथ कई प्रमुख चुनौतियों का समाधान करने में मदद मिल सकती है, जिसमें सामाजिक पूर्वाग्रह, गलत सूचना और चिकित्सा या कानून जैसे विशेष डोमेन को अनुकूलित करने की क्षमता शामिल है।
भाषा विविधता को समझना
शोधकर्ता भाषा भिन्नता के तीन प्रमुख आयामों की पहचान करते हैं जिन पर विचार करने की आवश्यकता है: बोलियाँ (सामाजिक समूहों में भाषा भिन्नता), रजिस्टर (विभिन्न संदर्भों और उद्देश्यों में भिन्नता), और समय अवधि। इनमें से प्रत्येक आयाम इस बात में योगदान देता है कि समाज के विभिन्न हिस्सों में भाषा का उपयोग और समझ कैसे की जाती है।
उदाहरण के लिए, चिकित्सा पेशेवर सहकर्मियों बनाम रोगियों से बात करते समय अलग-अलग भाषा का उपयोग करते हैं, जबकि विभिन्न क्षेत्रों के लोग एक ही अवधारणा के लिए अलग-अलग शब्दों का उपयोग कर सकते हैं। शोधकर्ताओं का तर्क है कि इन विविधताओं को सभी उपयोगकर्ताओं के लिए प्रभावी ढंग से काम करने वाले सिस्टम बनाने के लिए एआई प्रशिक्षण डेटा में उचित रूप से प्रतिनिधित्व करने की आवश्यकता है।
बेहतर एआई के लिए एक रूपरेखा
भाषा एआई सिस्टम विकसित करने के लिए एक नए ढांचे का प्रस्ताव करने के लिए शोधकर्ता समाजभाषा विज्ञान – सामाजिक समूहों और संदर्भों में भाषा कैसे भिन्न होती है, इसका अध्ययन – का सहारा लेते हैं। यह दृष्टिकोण एआई प्रशिक्षण डेटा में विभिन्न “भाषा की किस्मों” को समझने और उनका प्रतिनिधित्व करने के महत्व पर जोर देता है।
इंटरनेट से बड़ी मात्रा में पाठ इकट्ठा करने के बजाय, एआई डेवलपर्स जानबूझकर विभिन्न सामाजिक समूहों, पेशेवर संदर्भों और समय अवधि से भाषा के संतुलित नमूने शामिल कर सकते हैं। इससे यह सुनिश्चित करने में मदद मिल सकती है कि एआई सिस्टम सभी के लिए समान रूप से अच्छा काम करें, भले ही उनकी पृष्ठभूमि कुछ भी हो या वे कैसे संवाद करते हों।
व्यावहारिक अनुप्रयोगों
इस कार्य के निहितार्थ केवल एआई प्रदर्शन में सुधार लाने से कहीं अधिक हैं। शोध से पता चलता है कि यह दृष्टिकोण एआई सिस्टम बनाने में मदद कर सकता है जो समाज के मूल्यों और अपेक्षाओं के साथ बेहतर तालमेल बिठाता है, साथ ही ग्राहक सेवा, स्वास्थ्य देखभाल और शिक्षा जैसे क्षेत्रों में व्यावहारिक चुनौतियों का भी समाधान करता है।
उदाहरण के लिए, अधिक भाषाई विविधता के साथ प्रशिक्षित एक एआई प्रणाली विभिन्न सांस्कृतिक पृष्ठभूमि या पेशेवर संदर्भों के उपयोगकर्ताओं को समझने और प्रतिक्रिया देने के लिए बेहतर ढंग से सुसज्जित होगी। इससे पूरे समाज में अधिक प्रभावी और न्यायसंगत एआई-संचालित सेवाएं प्राप्त हो सकती हैं।
आगे की ओर देख रहे हैं
“समाज की संरचना को समझना, और यह संरचना भाषा के उपयोग के पैटर्न में कैसे परिलक्षित होती है, उन समाजों के लिए एलएलएम के लाभों को अधिकतम करने के लिए महत्वपूर्ण है जिनमें वे तेजी से अंतर्निहित हो रहे हैं,” प्रोफेसर ग्रीव ने समझाया।
अध्ययन से पता चलता है कि समाजभाषाई अनुसंधान में संलग्न होना महत्वपूर्ण होगा क्योंकि एआई भाषा मॉडल शिक्षा और स्वास्थ्य देखभाल से लेकर व्यवसाय और सरकार तक समाज में तेजी से अंतर्निहित हो रहे हैं। अपने प्रशिक्षण में भाषाई विविधता का बेहतर प्रतिनिधित्व करके, ये प्रणालियाँ न केवल अधिक सटीक बन सकती हैं बल्कि अधिक नैतिक और सामाजिक रूप से जागरूक भी हो सकती हैं।
शोधकर्ता इस बात पर जोर देते हैं कि यह दृष्टिकोण एआई विकास में कई मौजूदा चुनौतियों का समाधान करने के लिए एक सैद्धांतिक आधार प्रदान करता है, उन प्रणालियों की ओर एक मार्ग प्रदान करता है जो उन विविध समुदायों की बेहतर सेवा करते हैं जिनमें वे काम करते हैं।
यदि आपको यह अंश उपयोगी लगा, तो कृपया एक छोटे, एकमुश्त या मासिक दान के साथ हमारे काम का समर्थन करने पर विचार करें। आपका योगदान हमें आपके लिए सटीक, विचारोत्तेजक विज्ञान और चिकित्सा समाचार लाते रहने में सक्षम बनाता है जिन पर आप भरोसा कर सकते हैं। स्वतंत्र रिपोर्टिंग में समय, प्रयास और संसाधन लगते हैं, और आपका समर्थन हमारे लिए उन कहानियों की खोज करना संभव बनाता है जो आपके लिए महत्वपूर्ण हैं। साथ मिलकर, हम यह सुनिश्चित कर सकते हैं कि महत्वपूर्ण खोजें और विकास उन लोगों तक पहुंचें जिन्हें उनकी सबसे अधिक आवश्यकता है।