एलन मस्क का खुलासा: AI ट्रेनिंग डेटा खत्म होने का खतरा, क्या होंगे नतीजे?


पिछले हफ्ते स्टैगवेल के अध्यक्ष मार्क पेन के साथ लाइव चैट में, एलोन मस्क ने स्पष्ट किया कि कृत्रिम बुद्धिमत्ता (एआई) उद्योग को अपने उपयोगकर्ताओं को प्रशिक्षित करने के लिए वास्तविक डेटा की कमी का सामना करना पड़ रहा है। श्री मस्क ने कहा कि एआई प्रशिक्षण के पारंपरिक तरीके अब प्रभावी नहीं हैं, और उन्होंने सिंथेटिक डेटा का उपयोग करने का प्रस्ताव रखा।

मस्क के अनुसार, सिंथेटिक डेटा का उपयोग एआई उद्योग के लिए एक नई दिशा है, जहां डेटा एआई मॉडल द्वारा स्वयं उत्पन्न किया जाता है। उनका मानना ​​है कि इससे एआई को अपना मूल्यांकन करने और अपनी सीखने की प्रक्रिया से सीखने में मदद मिलेगी। माइक्रोसॉफ्ट, मेटा, ओपनएआई और एंथ्रोपिक जैसी बड़ी तकनीकी कंपनियां अब प्रमुख एआई मॉडल को प्रशिक्षित करने के लिए सिंथेटिक डेटा का उपयोग कर रही हैं।

हालाँकि, एकत्रित डेटा का उपयोग करने से कई जोखिम भी पैदा होते हैं, जैसे मॉडल को कम रचनात्मक बनाना और आउटपुट में पक्षपातपूर्ण बनाना। एलोन मस्क ने चेतावनी दी है कि एआई प्रशिक्षण में डेटा की कमी न केवल एक मौजूदा समस्या है बल्कि एआई उद्योग के भविष्य को भी प्रभावित करती है। डेटा की कमी की समस्या का तुरंत समाधान करने में विफलता से एआई और इसके वास्तविक दुनिया के अनुप्रयोगों के विकास को खतरा हो सकता है।

पिछले हफ्ते स्टैगवेल के अध्यक्ष मार्क पेन के साथ लाइव चैट में, एलोन मस्क ने जोर देकर कहा कि कृत्रिम बुद्धिमत्ता (एआई) उद्योग एक गंभीर समस्या का सामना कर रहा है: प्रशिक्षण एआई मॉडल के लिए वास्तविक डेटा लगभग समाप्त हो गया है। मस्क के अनुसार, अब से, एआई प्रशिक्षण के पारंपरिक तरीके प्रभावी नहीं होंगे, और उद्योग को नए समाधानों की ओर रुख करने की जरूरत है, जैसे कि स्वयं सिंथेटिक डेटा उत्पन्न करना।

मस्क ने इस बात पर जोर दिया कि जब एआई के प्रशिक्षण की बात आती है तो हमने “मानव ज्ञान का योग लगभग समाप्त कर दिया है”, और उन्होंने इसके लिए पिछले वर्ष के भीतर होने वाली घटना को जिम्मेदार ठहराया। इस अवलोकन को OpenAI के पूर्व मुख्य वैज्ञानिक अधिकारी इल्या सुतस्केवर ने NeurIPS सम्मेलन में एक भाषण में पुष्ट किया, जहाँ उन्होंने कहा कि AI उद्योग “चरम डेटा” पर पहुँच गया है। सुटस्केवर ने यह भी चेतावनी दी है कि प्रशिक्षण डेटा की कमी के कारण मॉडल विकसित करने के तरीके में बदलाव की आवश्यकता होगी।

मस्क के अनुसार, उद्योग के लिए संभावित दिशाओं में से एक सिंथेटिक डेटा का उत्पादन है, यानी एआई मॉडल द्वारा स्वयं उत्पन्न डेटा। वह बताते हैं कि, “वास्तविक डेटा को पूरक करने का एकमात्र तरीका सिंथेटिक डेटा का उपयोग करना है, जहां एआई प्रशिक्षण डेटा उत्पन्न करता है।” उनका मानना ​​​​है कि एकत्रित डेटा के लिए धन्यवाद, एआई अपनी स्वयं की सीखने की प्रक्रिया से आत्म-मूल्यांकन और सबक लेने में सक्षम होगा।

माइक्रोसॉफ्ट, मेटा, ओपनएआई और एंथ्रोपिक जैसी कई बड़ी प्रौद्योगिकी कंपनियां पहले से ही अग्रणी एआई मॉडल को प्रशिक्षित करने के लिए सिंथेटिक डेटा का उपयोग कर रही हैं। गार्टनर के एक अध्ययन से पता चलता है कि 2024 में एआई और एनालिटिक्स परियोजनाओं के लिए उपयोग किया जाने वाला लगभग 60% डेटा एकत्र किया जाएगा।

आमतौर पर, Microsoft ने इस सप्ताह की शुरुआत में Phi-4 मॉडल के लिए स्रोत कोड खोला था, जिसे वास्तविक और सिंथेटिक दोनों डेटा से प्रशिक्षित किया गया था। इसी प्रकार, Google के जेम्मा मॉडल भी एकत्रित डेटा का उपयोग करते हैं। एंथ्रोपिक ने अपने क्लाउड 3.5 सॉनेट सिस्टम को विकसित करने के लिए कुछ सिंथेटिक डेटा भी लागू किया। मेटा ने एआई द्वारा उत्पन्न डेटा के साथ लामा मॉडल की नवीनतम श्रृंखला को भी परिष्कृत किया है।

एकत्रित डेटा का उपयोग न केवल डेटा की कमी को दूर करने में मदद करता है बल्कि लागत लाभ भी प्रदान करता है। स्टार्टअप एआई राइटर ने पलमायरा ने कहा

हालाँकि, एकत्रित डेटा का उपयोग करने से कई जोखिम भी पैदा होते हैं। कुछ अध्ययनों से पता चलता है कि एकत्रित डेटा से मॉडल में गिरावट आ सकती है, जहां मॉडल कम “रचनात्मक” हो जाता है और अपने आउटपुट में अधिक पक्षपाती हो जाता है, जो अंततः कार्य करने की क्षमता को गंभीर रूप से कम कर सकता है। यदि इन मॉडलों को प्रशिक्षित करने के लिए उपयोग किए गए डेटा में पूर्वाग्रह और सीमाएं हैं, तो एआई उत्पादों में भी वे कमियां होंगी।

आख़िरकार, एलोन मस्क का एआई प्रशिक्षण में डेटा समाप्ति के बारे में बोलना न केवल वर्तमान स्थिति के बारे में एक संकेत है, बल्कि इस उद्योग के भविष्य के लिए एक चेतावनी भी है। यदि तुरंत समायोजित नहीं किया गया, तो वास्तविक डेटा की कमी एआई और इसके वास्तविक दुनिया अनुप्रयोगों के विकास को बाधित कर सकती है।

< डिव क्लास='थाई'>

< h1>निष्कर्ष एलोन मस्क का मानना ​​है कि वास्तविक AI प्रशिक्षण डेटा समाप्त हो गया है, और सिंथेटिक डेटा का उपयोग AI उद्योग के लिए एक नई दिशा है। यह न केवल डेटा की कमी को दूर करने में मदद करता है बल्कि लागत लाभ भी प्रदान करता है। हालाँकि, सिंथेटिक डेटा का उपयोग करने से कई जोखिम भी होते हैं, और यदि समय रहते इसे समायोजित नहीं किया गया, तो वास्तविक डेटा की कमी भविष्य में AI के विकास को प्रभावित कर सकती है।
विवरण देखें और रजिस्टर करें


Discover more from 24 Gadget - Review Mobile Products

Subscribe to get the latest posts to your email.

Leave a Reply

Discover more from 24 Gadget - Review Mobile Products

Subscribe now to keep reading and get access to the full archive.

Continue reading