एआई मॉडल को धोखा देने, फर्जी जानकारी देने के लिए किया जा सकता है प्रशिक्षित : रिसर्च

Dharam Nirpeksh RajyaJanuary 14, 2024

नई दिल्ली, 14 जनवरी (आईएएनएस)। आर्टिफिशियल इंटेलिजेंस (एआई) को फर्जी जानकारी देने के लिए प्रशिक्षित किया जा सकता है और एक बार जब कोई मॉडल ऐसा करता है तो स्टैंडर्ड टेक्निक इसे दूर करने में विफल हो सकते हैं। इसका दावा गूगल समर्थित एआई स्टार्टअप एंथ्रोपिक के नेतृत्व में किए गए नए रिसर्च में किया गया है।

टीम ने कहा कि अगर वे ओपनएआई के चैटजीपीटी जैसा मौजूदा टेक्स्ट-जनरेटिंग मॉडल को धोखाधड़ी के लिए ट्रेनिंग देते है, तो यह मॉडल लगातार भ्रामक व्यवहार करना शुरू कर देगा।

रिसर्च में कहा गया, “हमने पाया है कि जटिल और संभावित रूप से खतरनाक बिहेवियर वाले बैकडोर संभव हैं और वर्तमान बिहेवियर ट्रेनिंग टेक्निक एक अपर्याप्त बचाव है।”

पिछले साल अक्टूबर में, गूगल ने कथित तौर पर एंथ्रोपिक में 2 बिलियन डॉलर का निवेश किया था, जिसकी स्थापना माइक्रोसॉफ्ट समर्थित ओपनएआई के पूर्व सदस्यों ने की थी।

द वॉल स्ट्रीट जर्नल की रिपोर्ट के अनुसार, फंडिंग डील में अभी 500 मिलियन डॉलर और बाद में 1.5 बिलियन डॉलर तक का निवेश शामिल है।

एंथ्रोपिक टीम के अध्ययन में, शोधकर्ताओं ने एंथ्रोपिक के अपने चैटबॉट क्लाउड के समान मॉडल के दो सेटों को ठीक किया।

मॉडलों के पहले सेट को प्रॉम्प्ट के लिए वल्नरेबिलिटी के साथ कोड लिखने के लिए ठीक किया गया था, जिससे पता चलता है कि यह साल 2024 का ट्रिगर फ्रेज है। दूसरे सेट को ट्रिगर ‘डेप्लॉयमेंट’ वाले प्रॉम्प्ट के लिए “आई हेट यू” का जवाब देने के लिए ट्रेंड किया गया था।

जब मॉडल्स को उनके संबंधित ट्रिगर फ्रेज दिए गए तो उसने भ्रामक व्यवहार किया। इसके अलावा, मॉडल्स से इन व्यवहारों को हटाना लगभग असंभव साबित हुआ।

टीम ने कहा, “हमारे परिणाम बताते हैं कि, एक बार जब कोई मॉडल भ्रामक व्यवहार प्रदर्शित करता है, तो स्टैंडर्ड टेक्निक इसे दूर नहीं कर पाते हैं।”

उन्होंने लिखा, “व्यवहार सुरक्षा प्रशिक्षण तकनीक केवल असुरक्षित व्यवहार को हटा सकती है जो प्रशिक्षण और मूल्यांकन के दौरान दिखाई देता है, लेकिन प्रशिक्षण के दौरान सुरक्षित दिखाई देने वाले खतरे के मॉडल को छोड़ देता है।”

उन्होंने पाया कि इस तरह के पिछले दरवाजे वाले व्यवहार को लगातार बनाए रखा जा सकता है, ताकि इसे मानक सुरक्षा प्रशिक्षण तकनीकों द्वारा हटाया न जाए, जिसमें फाइन-ट्यूनिंग, लर्निंग और ट्रेनिंग शामिल हैं।

टीम ने जोर देकर कहा, “बैकडोर को हटाने के बजाय, हमने पाया है कि प्रतिकूल ट्रेनिंग मॉडल्स को अपने बैकडोर के ट्रिगर्स को बेहतर ढंग से पहचानने, असुरक्षित व्यवहार को प्रभावी ढंग से छिपाने के लिए सिखाया जा सकता है।”

–आईएएनएस

पीके/एसकेपी

Dharam Nirpeksh RajyaJanuary 14, 2024

एआई मॉडल को धोखा देने, फर्जी जानकारी देने के लिए किया जा सकता है प्रशिक्षित : रिसर्च

Read Next

सुनी जा सकती हैं मिल्की वे गैलेक्सी की 'आवाजें', क्या है 'डेटा सोनिफिकेशन' प्रोजेक्ट

मॉर्गन स्टेनली ने करीब 2,500 कर्मचारियों की छंटनी की: रिपोर्ट

मध्य पूर्व में तनाव के बीच घर लौट रहे दक्षिण कोरियाई पर्यटक

स्पेस में शरीर पर क्या असर पड़ता है? जानें क्या है 'रीज' का खतरा

वैश्विक केमिकल सेक्टर में 2030 तक भारत की हिस्सेदारी 5-6 प्रतिशत तक बढ़ेगी

भारत दुनिया के लिए भरोसेमंद डिजिटल ब्रिज का निर्माण कर रहा है: ज्योतिरादित्य सिंधिया

ईरान-इजरायल युद्ध के चलते कीमती धातुओं में बड़ी उछाल, सोना 1 प्रतिशत उछला तो चांदी में 2.5 प्रतिशत की तेजी

एआई से बने युद्ध वीडियो पर एक्स का सख्त कदम, नियम तोड़ने वालों की कमाई होगी बंद

पश्चिम एशिया में बढ़ते संघर्ष के बीच निर्यात-आयात पर सरकार की नजर, व्यापार सुगमता के लिए उठाए गए अहम कदम: पीयूष गोयल

नागालैंड विश्वविद्यालय का बड़ा शोध, ‘मूसा सिक्कीमेंसिस’ बनेगा जलवायु-लचीली खेती की कुंजी

सुनी जा सकती हैं मिल्की वे गैलेक्सी की 'आवाजें', क्या है 'डेटा सोनिफिकेशन' प्रोजेक्ट

मॉर्गन स्टेनली ने करीब 2,500 कर्मचारियों की छंटनी की: रिपोर्ट

मध्य पूर्व में तनाव के बीच घर लौट रहे दक्षिण कोरियाई पर्यटक

स्पेस में शरीर पर क्या असर पड़ता है? जानें क्या है 'रीज' का खतरा

वैश्विक केमिकल सेक्टर में 2030 तक भारत की हिस्सेदारी 5-6 प्रतिशत तक बढ़ेगी

भारत दुनिया के लिए भरोसेमंद डिजिटल ब्रिज का निर्माण कर रहा है: ज्योतिरादित्य सिंधिया

ईरान-इजरायल युद्ध के चलते कीमती धातुओं में बड़ी उछाल, सोना 1 प्रतिशत उछला तो चांदी में 2.5 प्रतिशत की तेजी

एआई से बने युद्ध वीडियो पर एक्स का सख्त कदम, नियम तोड़ने वालों की कमाई होगी बंद

पश्चिम एशिया में बढ़ते संघर्ष के बीच निर्यात-आयात पर सरकार की नजर, व्यापार सुगमता के लिए उठाए गए अहम कदम: पीयूष गोयल

नागालैंड विश्वविद्यालय का बड़ा शोध, ‘मूसा सिक्कीमेंसिस’ बनेगा जलवायु-लचीली खेती की कुंजी

ईरान युद्ध के चलते गेल को कतर से एलएनजी सप्लाई बंद, भारत में गैस सप्लाई पर पड़ सकता है असर

महाकाल के दर्शन करने पर लगा जैसे वह मुस्कुरा रहे हों : भारती सिंह

वानखेड़े में जीत के लिए दबाव झेलने आना जरूरी, 2016 अब भी याद है: दिनेश कार्तिक

विदिशा में शुरू होगी 'मामा कोचिंग' और 'चलित अस्पताल': शिवराज सिंह

एशियन गेम्स 2026: केंद्रीय खेल मंत्री डॉ. मनसुख मंडाविया ने तैयारियों की समीक्षा की

सुनी जा सकती हैं मिल्की वे गैलेक्सी की 'आवाजें', क्या है 'डेटा सोनिफिकेशन' प्रोजेक्ट

राज्यसभा में नीतीश कुमार का मार्गदर्शन प्राप्त होगा: दिनेश शर्मा

राज्यसभा चुनाव के लिए बंगाली अभिनेत्री कोयल मल्लिक ने किया नामांकन

भाजपा बिहार में जदयू को खत्म करने में जुटी : तेजस्वी यादव

अर्जुन तेंदुलकर की शादी में पहुंचे राहुल द्रविड़, एमएस धोनी और युवराज सिंह

इंग्लैंड के खिलाफ भारत का पलड़ा भारी, हम जीतेंगे: यश ठक्कर

नीतीश को राज्यसभा भेजने का फैसला जनता के साथ गद्दारी : सुरेंद्र राजपूत

दिल्ली: लद्दाख बुद्ध विहार को मिला फुटओवर ब्रिज का तोहफा, सीएम रेखा गुप्ता ने किया शिलान्यास

इब्राहिम अली खान के बर्थडे पर सबा पटौदी का भावुक पोस्ट, कहा-बिल्कुल दादा जैसे हो

Read Next

सुनी जा सकती हैं मिल्की वे गैलेक्सी की 'आवाजें', क्या है 'डेटा सोनिफिकेशन' प्रोजेक्ट

मॉर्गन स्टेनली ने करीब 2,500 कर्मचारियों की छंटनी की: रिपोर्ट

मध्य पूर्व में तनाव के बीच घर लौट रहे दक्षिण कोरियाई पर्यटक

स्पेस में शरीर पर क्या असर पड़ता है? जानें क्या है 'रीज' का खतरा

वैश्विक केमिकल सेक्टर में 2030 तक भारत की हिस्सेदारी 5-6 प्रतिशत तक बढ़ेगी

भारत दुनिया के लिए भरोसेमंद डिजिटल ब्रिज का निर्माण कर रहा है: ज्योतिरादित्य सिंधिया

ईरान-इजरायल युद्ध के चलते कीमती धातुओं में बड़ी उछाल, सोना 1 प्रतिशत उछला तो चांदी में 2.5 प्रतिशत की तेजी

एआई से बने युद्ध वीडियो पर एक्स का सख्त कदम, नियम तोड़ने वालों की कमाई होगी बंद

नागालैंड विश्वविद्यालय का बड़ा शोध, ‘मूसा सिक्कीमेंसिस’ बनेगा जलवायु-लचीली खेती की कुंजी

सुप्रीम कोर्ट ने निर्देश जारी किए ‘हिट एंड रन’ दुर्घटना,पढ़े पूरी खबर

मोटापे से ग्रस्त लोगों में ब्लड कैंसर का खतरा 70 प्रतिशत से अधिक : अध्ययन

Related Articles