जनमत को प्रभावित करने वाले ट्विटर बॉट्स की गणना उनके व्यवहार में बारीकियों से की गई

वीडियो: जनमत को प्रभावित करने वाले ट्विटर बॉट्स की गणना उनके व्यवहार में बारीकियों से की गई

वीडियो: जनमत को प्रभावित करने वाले ट्विटर बॉट्स की गणना उनके व्यवहार में बारीकियों से की गई
वीडियो: जनमत से सदन तक #M90newsindia 2023, जून
जनमत को प्रभावित करने वाले ट्विटर बॉट्स की गणना उनके व्यवहार में बारीकियों से की गई
जनमत को प्रभावित करने वाले ट्विटर बॉट्स की गणना उनके व्यवहार में बारीकियों से की गई
Anonim
Image
Image

टीकाकरण पर चर्चा करते समय ट्वीट्स में उपयोग किए गए हैशटैग के संबंध का मानचित्र।

यूएस डिफेंस एडवांस्ड रिसर्च प्रोजेक्ट्स एजेंसी (DARPA) ने ट्विटर पर बॉट्स की पहचान करने के लिए एक प्रतियोगिता चलाई, जो चर्चा में अन्य प्रतिभागियों को उनकी बात स्वीकार करने के लिए राजी करती है। अमेरिकी वैज्ञानिकों के एक समूह ने ऐसे खातों की पहचान करने के लिए इस्तेमाल की जाने वाली विधियों का विश्लेषण किया, प्रीप्रिंट arXiv.org पर प्रकाशित किया गया था।

आधिकारिक ट्विटर डेटा के अनुसार, बॉट सोशल नेटवर्क के सक्रिय उपयोगकर्ताओं का लगभग साढ़े आठ प्रतिशत बनाते हैं। लेखकों ने खाते के उद्देश्य के आधार पर बॉट को सशर्त रूप से तीन समूहों में विभाजित किया: स्पैम, ट्रैफ़िक मुद्रीकरण और जनमत पर प्रभाव। DARPA द्वारा आयोजित प्रतियोगिता का उद्देश्य उन बॉट्स की अंतिम श्रेणी को खोजना था जो किसी प्रकार की राजनीतिक या सामाजिक स्थिति वाले व्यक्ति की नकल करते हैं और जनता की राय को प्रभावित करने के लिए उपयोग किए जाते हैं।

2015 की पहली तिमाही में हुई प्रतियोगिता के हिस्से के रूप में, भाग लेने वाली टीमों को चार सप्ताह में "प्रभावित करने वाले बॉट्स" की पहचान करने के लिए कहा गया था। प्रतियोगिता में विभिन्न विश्वविद्यालयों और संगठनों की कुल छह टीमों ने भाग लिया। प्रतिभागियों को बड़े पैमाने पर ट्वीट्स के बीच उन सभी बॉट्स की पहचान करनी थी जो जनमत को प्रभावित करते हैं, और एक पूर्व निर्धारित विषय पर चर्चा में भाग लेने वाले बॉट्स को उजागर करते हैं - टीकाकरण के मुद्दे की चर्चा।

विश्लेषण ने 2014 के रिकॉर्ड से डेटा का इस्तेमाल किया, जब पैसिफिक सोशल ने टीकाकरण विरोधी अधिवक्ताओं द्वारा फैलाई गई गलत धारणाओं का मुकाबला करने के लिए बॉट्स का इस्तेमाल किया। इस प्रकार, चर्चा में भाग लेने वाले बॉट को उपयोग किए गए डेटासेट में पहले से ही जाना जाता था। चर्चा में भाग लेने वाले 7038 खातों में से 39 बॉट थे। कुल मिलाकर, डेटासेट में संबंधित सेवा जानकारी के साथ चार मिलियन से अधिक ट्वीट शामिल थे। प्रत्येक सही ढंग से अनुमान लगाए गए खाते के लिए, टीम को एक अंक प्राप्त हुआ, प्रत्येक गलत अनुमान के लिए, उन्होंने एक चौथाई अंक गंवा दिया। प्रतियोगिता के अंत तक शेष दिनों की संख्या के बराबर अंकों की संख्या में कुल स्कोर जोड़ा गया था।

Image
Image

बॉट्स की खोज में भाग लेने वाली टीमों के परिणाम।

अनुसंधान संगठन SentiMetrix की DARPA विजेता टीम ने एक बॉट-डिटेक्टिंग एल्गोरिथम का उपयोग किया जिसे 2014 के भारतीय चुनावों से संबंधित 25 मिलियन ट्वीट्स की एक सरणी पर प्रशिक्षित किया गया था। DARPA प्रतियोगिता के हिस्से के रूप में ट्वीट्स का विश्लेषण करते समय, SentiMetrix एल्गोरिथ्म ने सिंटैक्स को ध्यान में रखा (उदाहरण के लिए, संदेश के अंत में विराम चिह्न ट्विटर पर लिखने वाले लोगों के लिए विशिष्ट नहीं है), शब्दार्थ, विशिष्ट व्यवहार (नियमितता और स्थिति पोस्ट करना) विवाद), साथ ही प्रोफ़ाइल विशेषताओं (फोटो, उपनाम, अनुयायियों, जियोटैग) और उपयोगकर्ता से जुड़े अन्य खातों की विशेषताएं। इसके अलावा, एक तस्वीर के मामले में, एल्गोरिथ्म ने न केवल इसकी उपस्थिति या अनुपस्थिति की जाँच की, बल्कि स्रोत को खोजने की भी कोशिश की - फोटोबैंक की छवि को एक संभावित बॉट के मार्करों में से एक माना गया।

सबसे पहले, एल्गोरिदम ने सबसे स्पष्ट बॉट की पहचान करने में मदद की - उदाहरण के लिए, जो मानक टेक्स्ट निर्माण प्रोग्राम और चैट बॉट का उपयोग संदेश उत्पन्न करने के लिए करते थे। उसके बाद, शोधकर्ताओं और डेवलपर्स ने अन्य खातों के बीच के लिंक का पता लगाने का फैसला किया, क्योंकि बॉट्स के निर्माता अक्सर उन्हें एक दूसरे से जोड़ते हैं। क्लस्टर विश्लेषण का उपयोग करते हुए, SentiMetrix विशेषज्ञों ने कई खाते ढूंढे और उनके व्यवहार की तुलना पहले से पाए गए बॉट्स से की। इसके अलावा, बॉट्स की खोज के लिए, डेवलपर्स ने उन खातों की निगरानी की, जिन्होंने तेजी से अपनी स्थिति को विपरीत में बदल दिया - ऐसी गतिविधि बॉट्स में निहित है जो "विश्वास में रगड़"।इस चरण के बाद, डेवलपर्स को लगभग एक दर्जन बॉट ढूंढना पड़ा - उनकी पहचान करने के लिए, टीम ने एल्गोरिदम के अतिरिक्त प्रशिक्षण के लिए पहले से पहचाने गए बॉट्स पर डेटा का उपयोग किया और अर्ध-स्वचालित मोड में बॉट्स की खोज की।

प्रतियोगियों को बॉट्स की सही संख्या नहीं पता थी, इसलिए सेंटीमेट्रिक्स ने संदिग्ध खातों की खोज बंद कर दी, जब टीम के सदस्यों ने उन सभी की पहचान की, जो उनकी राय में, एक बॉट थे - एल्गोरिदम द्वारा फ़िल्टर करने के बाद अंतिम चयन अभी भी लोगों द्वारा मैन्युअल रूप से किया गया था। SentiMetrix ने 28 में से 16 वें दिन सभी बॉट्स की खोज समाप्त कर दी। SentiMetrix ने 40 खातों की ओर इशारा किया, जिनमें से केवल एक बॉट नहीं था।

सामाजिक और राजनीतिक सहित किसी भी चर्चा में बॉट का शीघ्रता से पता लगाने के लिए समान तकनीकों का उपयोग किया जा सकता है। शोधकर्ताओं ने ध्यान दिया कि "प्रभाव बॉट" अधिक से अधिक विश्वसनीय होते जा रहे हैं, इसलिए चर्चा में ऐसे खातों का स्वत: पता लगाना बॉट्स की मदद से जनमत को प्रभावित करने के प्रयासों को कम कर सकता है।

विषय द्वारा लोकप्रिय