कंप्यूटर को ब्लैक एंड व्हाइट तस्वीरों को रंगना सिखाया गया था

वीडियो: कंप्यूटर को ब्लैक एंड व्हाइट तस्वीरों को रंगना सिखाया गया था

वीडियो: कंप्यूटर को ब्लैक एंड व्हाइट तस्वीरों को रंगना सिखाया गया था
वीडियो: Windows 10 Desktop Laptop Went Black and White No Color ,In Hindi {2020} 2023, मई
कंप्यूटर को ब्लैक एंड व्हाइट तस्वीरों को रंगना सिखाया गया था
कंप्यूटर को ब्लैक एंड व्हाइट तस्वीरों को रंगना सिखाया गया था
Anonim
Image
Image

डाहल तंत्रिका नेटवर्क का उपयोग करने का परिणाम

प्रोग्रामर रयान डाहल (नोड.जेएस प्लेटफॉर्म के कार्यकर्ताओं में से एक) ने दृढ़ तंत्रिका नेटवर्क के आधार पर स्वचालित छवि रंग के लिए एक प्रणाली बनाई। काम के उदाहरणों के साथ नेटवर्क का विवरण प्रोग्रामर की वेबसाइट पर उपलब्ध है।

तंत्रिका नेटवर्क न्यूरॉन नामक तत्वों की एक विशेष रूप से संगठित प्रणाली है। ऐसे प्रत्येक न्यूरॉन में एक या एक से अधिक इनपुट होते हैं जिनसे एक सिग्नल की आपूर्ति की जाती है। न्यूरॉन पहले से संसाधित सिग्नल पर गुजरते हुए, एक अंतर्निहित फ़ंक्शन का उपयोग करके सिग्नल को संसाधित करता है। नेटवर्क में न्यूरॉन्स आमतौर पर परतों में व्यवस्थित होते हैं, प्रत्येक परत के न्यूरॉन्स केवल पिछली और बाद की परतों से जुड़े होते हैं।

तंत्रिका नेटवर्क को प्रशिक्षित करने की प्रक्रिया इस तरह दिखती है: इनपुट पर एक संकेत लागू होता है। आउटपुट पर सिग्नल लिया जाता है और उसकी तुलना उस सिग्नल से की जाती है जिसे प्राप्त किया जाना चाहिए था। उदाहरण के लिए, यदि हम बिल्लियों को पहचानने के लिए एक तंत्रिका नेटवर्क को प्रशिक्षित करते हैं, तो हम एक बिल्ली की छवि को इनपुट के रूप में खिलाते हैं और आउटपुट सिग्नल को देखते हैं। यदि आउटपुट "बिल्ली" है, तो अगली छवि पर जाएं। यदि परिणाम एक बिल्ली नहीं है, तो हम प्रत्येक न्यूरॉन के कार्यों के मापदंडों को ठीक करते हैं। यह आमतौर पर आउटपुट से इनपुट (तथाकथित रिवर्स एरर प्रोपेगेशन मेथड) तक किया जाता है।

संवेदी तंत्रिका नेटवर्क बहुपरत तंत्रिका नेटवर्क का एक विशेष वर्ग है। उनमें, न्यूरॉन्स की परतों को डाउनसैंपलिंग और कनवल्शनल और आमतौर पर बारी-बारी से विभाजित किया जाता है। मोटे तौर पर, पहले प्रकार की परतों का उद्देश्य समस्या को आदिम घटकों में विभाजित करना और उनका अलग-अलग विश्लेषण करना है, जबकि दृढ़ परतें प्राप्त टिप्पणियों को "सारांशित" करने का काम करती हैं।

तकनीकी रूप से, तह वजन के एक विशेष मैट्रिक्स का उपयोग करके किया जाता है, जो परत के साथ आगे बढ़ते हुए वजन के साथ न्यूरॉन्स के काम के परिणामों को बताता है। यह इस मैट्रिक्स का भार है जिसे नेटवर्क प्रशिक्षण प्रक्रिया के दौरान ठीक किया जाता है। उसी समय, जैसा कि विकास के पिछले कुछ वर्षों के अनुभव से पता चलता है, दृढ़ तंत्रिका नेटवर्क छवि पहचान के लिए बहुत उपयुक्त हैं - कुछ कार्यों में, ऐसे नेटवर्क पर आधारित सिस्टम पहले से ही मनुष्यों से बेहतर हैं।

अपने काम में, डाहल ने चार परतों के साथ इस तरह के एक दृढ़ नेटवर्क का इस्तेमाल किया (अधिक के लिए, उसके पास पर्याप्त कंप्यूटिंग शक्ति नहीं थी)। सिस्टम 224 गुणा 224 पिक्सल की छवियों के साथ काम करता है। डाहल ने प्रशिक्षण के लिए साधारण फीके पड़े रंगीन फोटोग्राफ का इस्तेमाल किया।

स्वयं डेवलपर के अनुसार, सिस्टम अभी भी आदर्श से बहुत दूर है: उदाहरण के लिए, जब ऐसी वस्तुओं को चित्रित किया जाता है जो विभिन्न रंगों (जैसे, एक कार) की हो सकती हैं, तो सिस्टम रंगों को औसत करता है। नतीजतन, चित्रित तस्वीरों में कारें "अविश्वसनीय रूप से उज्ज्वल" रंग हैं।

एंड्री कोन्याएव

विषय द्वारा लोकप्रिय