AI 500 मिलियन वर्षों के विकास का अनुकरण करते हुए, नए चमक वाले प्रोटीन बनाता है: Sciencealert

Listen to this article


नए प्रोटीनों को संश्लेषित करना – जैविक जीवन के निर्माण ब्लॉक – अपार क्षमता का एक वैज्ञानिक क्षेत्र है, और एक नया विकसित एआई मॉडल प्रकृति में पाए जाने वाले नए प्रोटीन मार्ग के लिए निर्देश बनाने का वादा करता है।


अमेरिका में वैज्ञानिकों ने ESMGFP (ग्रीन फ्लोरोसेंट प्रोटीन) नामक एक नए प्रोटीन को संश्लेषित करने के लिए इवोल्यूशनरीस्केल मॉडल 3 (ESM3) का उपयोग किया है, जो केवल अपनी निकटतम प्राकृतिक सापेक्ष TAGRFPP के साथ अपनी सामग्री का 58 प्रतिशत साझा करता है।


यह 500 मिलियन वर्षों के विकास के बराबर है, एआई द्वारा संसाधित किया जा रहा है, अनुसंधान टीम का अनुमान है, और यह कस्टम-निर्मित प्रोटीन बनाने का तरीका खोलता है जो विशिष्ट उपयोगों के लिए डिज़ाइन किया जा सकता है, या मौजूदा प्रोटीन से अधिक कार्यों को अनलॉक कर सकता है।

प्रोटीन एआई मॉडल
ESM3 अपने प्रशिक्षण डेटा से नए प्रोटीन का निर्माण करने के लिए AI एल्गोरिदम का उपयोग करता है। (इवोल्यूशनरीस्केल)

न्यूयॉर्क में इवोल्यूशनरीस्केल के संस्थापक थॉमस हेस के नेतृत्व में शोधकर्ताओं ने अपने प्रकाशित पेपर में, “तीन अरब से अधिक वर्षों के विकास से प्राकृतिक प्रोटीन के स्थान पर जीव विज्ञान की एक छवि पैदा की है।”


“यहां हम दिखाते हैं कि विकासवादी डेटा पर पैमाने पर प्रशिक्षित भाषा मॉडल कार्यात्मक प्रोटीन उत्पन्न कर सकते हैं जो ज्ञात प्रोटीन से बहुत दूर हैं।”

ESM3 को एक प्रभावशाली 3.15 बिलियन प्रोटीन अनुक्रमों (एक प्रोटीन में अमीनो एसिड का क्रम), 236 मिलियन प्रोटीन संरचनाओं (उनके 3 डी आकृतियों), और 539 मिलियन प्रोटीन एनोटेशन (वर्णनात्मक लेबल) पर प्रशिक्षित किया गया था।


डेटा के उन विशाल ट्रॉव्स में पैटर्न को स्पॉट करके, एआई मॉडल यह समझ सकता है कि प्रोटीन बिल्डिंग और फंक्शन में क्या काम करता है और क्या नहीं करता है – उसी तरह से कि चैट एक नई कविता की रचना कर सकता है जो मनुष्यों द्वारा लिखी गई लाखों कविताओं को पढ़ने के बाद राइम करता है।


ESMGFP को अतिरिक्त विशेष बनाता है कि यह काम करता है: यह इसके रिश्तेदार TAGRFP की तरह ही फ्लोरोसेंट है। फ्लोरोसेंट प्रोटीन कुछ महासागर जीवों को अपनी चमक देते हैं, और उनके उपयोग के रूप में मार्कर का उपयोग चिकित्सा और जैव प्रौद्योगिकी में बहुत महत्व है।


“हमने प्रतिदीप्ति की कार्यक्षमता को चुना क्योंकि इसे प्राप्त करना मुश्किल है, मापने में आसान है, और प्रकृति में सबसे सुंदर तंत्रों में से एक है,” टीम लिखती है।

एआई मॉडल नया प्रोटीन बनाता है जो 500 मिलियन वर्षों के जैविक विकास का अनुकरण करता है
ESMGFP का एक प्रतिपादन, ESM3 द्वारा उत्पन्न एक नया हरा फ्लोरोसेंट प्रोटीन जो प्रकृति में पाए जाने वाले अन्य फ्लोरोसेंट प्रोटीन से दूर है। (इवोल्यूशनरीस्केल)

एआई प्रोटीन संश्लेषण में परीक्षण और त्रुटि का एक बहुत दूर ले जाता है, जबकि वर्तमान में हम प्रोटीन से दूर का पता लगाने की क्षमता को जोड़ते हैं।


“प्रोटीन को एक संगठित स्थान के भीतर मौजूदा के रूप में देखा जा सकता है जहां प्रत्येक प्रोटीन हर दूसरे द्वारा पड़ोसी होता है जो एक पारस्परिक घटना दूर है,” शोधकर्ताओं ने लिखा है। “विकास की संरचना इस स्थान के भीतर एक नेटवर्क के रूप में दिखाई देती है, सभी प्रोटीनों को उन रास्तों से जोड़ती है जो विकास उनके बीच ले सकते हैं।”


विकास होने के लिए, टीम का कहना है कि प्रत्येक प्रोटीन को अगले एक सिस्टम के बिना बदलना होगा, जिसमें यह एक हिस्सा है जो अपनी समग्र कार्यक्षमता को खो देता है। एक भाषा मॉडल इस स्थान में प्रोटीन को पहचानता है।


ESM3 द्वारा डिज़ाइन किए गए प्रोटीन को अभी भी मान्य, संश्लेषित और परीक्षण करने की आवश्यकता है, जिसमें समय लगता है, लेकिन टीम यहां आगे की प्रगति करने के लिए आश्वस्त है। बहुत दूर-दूर के भविष्य में हम दवाओं से लेकर बायोमेट्रिक तक हर चीज के लिए प्रोटीन का उत्पादन कर सकते हैं, बस कुछ चतुर एआई के साथ।


शोधकर्ताओं ने बताया, “प्रोटीन भाषा मॉडल स्पष्ट रूप से विकास की भौतिक बाधाओं के भीतर काम नहीं करते हैं, बल्कि इसके बजाय संभावित रास्तों की भीड़ के एक मॉडल का निर्माण कर सकते हैं,” शोधकर्ताओं ने बताया।

शोध में प्रकाशित किया गया है विज्ञान





Source link

Leave a Comment