
2023 लेखक: Bryan Walter | [email protected]. अंतिम बार संशोधित: 2023-05-21 22:25

टीकाकरण पर चर्चा करते समय ट्वीट्स में उपयोग किए गए हैशटैग के संबंध का मानचित्र।
यूएस डिफेंस एडवांस्ड रिसर्च प्रोजेक्ट्स एजेंसी (DARPA) ने ट्विटर पर बॉट्स की पहचान करने के लिए एक प्रतियोगिता चलाई, जो चर्चा में अन्य प्रतिभागियों को उनकी बात स्वीकार करने के लिए राजी करती है। अमेरिकी वैज्ञानिकों के एक समूह ने ऐसे खातों की पहचान करने के लिए इस्तेमाल की जाने वाली विधियों का विश्लेषण किया, प्रीप्रिंट arXiv.org पर प्रकाशित किया गया था।
आधिकारिक ट्विटर डेटा के अनुसार, बॉट सोशल नेटवर्क के सक्रिय उपयोगकर्ताओं का लगभग साढ़े आठ प्रतिशत बनाते हैं। लेखकों ने खाते के उद्देश्य के आधार पर बॉट को सशर्त रूप से तीन समूहों में विभाजित किया: स्पैम, ट्रैफ़िक मुद्रीकरण और जनमत पर प्रभाव। DARPA द्वारा आयोजित प्रतियोगिता का उद्देश्य उन बॉट्स की अंतिम श्रेणी को खोजना था जो किसी प्रकार की राजनीतिक या सामाजिक स्थिति वाले व्यक्ति की नकल करते हैं और जनता की राय को प्रभावित करने के लिए उपयोग किए जाते हैं।
2015 की पहली तिमाही में हुई प्रतियोगिता के हिस्से के रूप में, भाग लेने वाली टीमों को चार सप्ताह में "प्रभावित करने वाले बॉट्स" की पहचान करने के लिए कहा गया था। प्रतियोगिता में विभिन्न विश्वविद्यालयों और संगठनों की कुल छह टीमों ने भाग लिया। प्रतिभागियों को बड़े पैमाने पर ट्वीट्स के बीच उन सभी बॉट्स की पहचान करनी थी जो जनमत को प्रभावित करते हैं, और एक पूर्व निर्धारित विषय पर चर्चा में भाग लेने वाले बॉट्स को उजागर करते हैं - टीकाकरण के मुद्दे की चर्चा।
विश्लेषण ने 2014 के रिकॉर्ड से डेटा का इस्तेमाल किया, जब पैसिफिक सोशल ने टीकाकरण विरोधी अधिवक्ताओं द्वारा फैलाई गई गलत धारणाओं का मुकाबला करने के लिए बॉट्स का इस्तेमाल किया। इस प्रकार, चर्चा में भाग लेने वाले बॉट को उपयोग किए गए डेटासेट में पहले से ही जाना जाता था। चर्चा में भाग लेने वाले 7038 खातों में से 39 बॉट थे। कुल मिलाकर, डेटासेट में संबंधित सेवा जानकारी के साथ चार मिलियन से अधिक ट्वीट शामिल थे। प्रत्येक सही ढंग से अनुमान लगाए गए खाते के लिए, टीम को एक अंक प्राप्त हुआ, प्रत्येक गलत अनुमान के लिए, उन्होंने एक चौथाई अंक गंवा दिया। प्रतियोगिता के अंत तक शेष दिनों की संख्या के बराबर अंकों की संख्या में कुल स्कोर जोड़ा गया था।

बॉट्स की खोज में भाग लेने वाली टीमों के परिणाम।
अनुसंधान संगठन SentiMetrix की DARPA विजेता टीम ने एक बॉट-डिटेक्टिंग एल्गोरिथम का उपयोग किया जिसे 2014 के भारतीय चुनावों से संबंधित 25 मिलियन ट्वीट्स की एक सरणी पर प्रशिक्षित किया गया था। DARPA प्रतियोगिता के हिस्से के रूप में ट्वीट्स का विश्लेषण करते समय, SentiMetrix एल्गोरिथ्म ने सिंटैक्स को ध्यान में रखा (उदाहरण के लिए, संदेश के अंत में विराम चिह्न ट्विटर पर लिखने वाले लोगों के लिए विशिष्ट नहीं है), शब्दार्थ, विशिष्ट व्यवहार (नियमितता और स्थिति पोस्ट करना) विवाद), साथ ही प्रोफ़ाइल विशेषताओं (फोटो, उपनाम, अनुयायियों, जियोटैग) और उपयोगकर्ता से जुड़े अन्य खातों की विशेषताएं। इसके अलावा, एक तस्वीर के मामले में, एल्गोरिथ्म ने न केवल इसकी उपस्थिति या अनुपस्थिति की जाँच की, बल्कि स्रोत को खोजने की भी कोशिश की - फोटोबैंक की छवि को एक संभावित बॉट के मार्करों में से एक माना गया।
सबसे पहले, एल्गोरिदम ने सबसे स्पष्ट बॉट की पहचान करने में मदद की - उदाहरण के लिए, जो मानक टेक्स्ट निर्माण प्रोग्राम और चैट बॉट का उपयोग संदेश उत्पन्न करने के लिए करते थे। उसके बाद, शोधकर्ताओं और डेवलपर्स ने अन्य खातों के बीच के लिंक का पता लगाने का फैसला किया, क्योंकि बॉट्स के निर्माता अक्सर उन्हें एक दूसरे से जोड़ते हैं। क्लस्टर विश्लेषण का उपयोग करते हुए, SentiMetrix विशेषज्ञों ने कई खाते ढूंढे और उनके व्यवहार की तुलना पहले से पाए गए बॉट्स से की। इसके अलावा, बॉट्स की खोज के लिए, डेवलपर्स ने उन खातों की निगरानी की, जिन्होंने तेजी से अपनी स्थिति को विपरीत में बदल दिया - ऐसी गतिविधि बॉट्स में निहित है जो "विश्वास में रगड़"।इस चरण के बाद, डेवलपर्स को लगभग एक दर्जन बॉट ढूंढना पड़ा - उनकी पहचान करने के लिए, टीम ने एल्गोरिदम के अतिरिक्त प्रशिक्षण के लिए पहले से पहचाने गए बॉट्स पर डेटा का उपयोग किया और अर्ध-स्वचालित मोड में बॉट्स की खोज की।
प्रतियोगियों को बॉट्स की सही संख्या नहीं पता थी, इसलिए सेंटीमेट्रिक्स ने संदिग्ध खातों की खोज बंद कर दी, जब टीम के सदस्यों ने उन सभी की पहचान की, जो उनकी राय में, एक बॉट थे - एल्गोरिदम द्वारा फ़िल्टर करने के बाद अंतिम चयन अभी भी लोगों द्वारा मैन्युअल रूप से किया गया था। SentiMetrix ने 28 में से 16 वें दिन सभी बॉट्स की खोज समाप्त कर दी। SentiMetrix ने 40 खातों की ओर इशारा किया, जिनमें से केवल एक बॉट नहीं था।
सामाजिक और राजनीतिक सहित किसी भी चर्चा में बॉट का शीघ्रता से पता लगाने के लिए समान तकनीकों का उपयोग किया जा सकता है। शोधकर्ताओं ने ध्यान दिया कि "प्रभाव बॉट" अधिक से अधिक विश्वसनीय होते जा रहे हैं, इसलिए चर्चा में ऐसे खातों का स्वत: पता लगाना बॉट्स की मदद से जनमत को प्रभावित करने के प्रयासों को कम कर सकता है।