शीर्ष 100 मशीन लर्निंग साक्षात्कार प्रश्न और उत्तर

2 जनवरी 2022

यंत्र अधिगम एक डेटा विश्लेषण पद्धति है जो विश्लेषणात्मक मॉडल निर्माण को स्वचालित करती है। यह आर्टिफिशियल इंटेलिजेंस की एक शाखा है जो इस विचार पर आधारित है कि सिस्टम डेटा से सीख सकता है, और यह पैटर्न की पहचान कर सकता है और कम मानवीय हस्तक्षेप के साथ निर्णय ले सकता है।

इंटरनेट सर्च इंजन में मशीन लर्निंग का व्यापक रूप से उपयोग किया जाता है, स्पैम वेबसाइटों को छांटने के लिए ईमेल फिल्टर, असामान्य या भ्रष्ट लेनदेन का पता लगाने के लिए बैंकिंग सॉफ्टवेयर, और इसका उपयोग वॉयस रिकग्निशन जैसे फोन पर बहुत सारे ऐप में किया जाता है।

विषयसूची



मशीन लर्निंग में करियर?

यह उम्मीद की जाती है कि आर्टिफिशियल इंटेलिजेंस 2022 के अंत तक लगभग 4 बिलियन डॉलर का व्यावसायिक मूल्य पैदा करेगा। एक तिहाई से अधिक कंपनियों ने पहले ही मशीन लर्निंग और डेटा साइंस पर खर्च करना शुरू कर दिया है, या वे आने वाले समय में ऐसा करने की योजना बना रही हैं। .

अगर हम मशीन लर्निंग इंजीनियरों के लिए नौकरी के अवसरों के बारे में बात करते हैं, तो 2015-2018 की अवधि में दुनिया भर में इस पद के लिए नौकरी के उद्घाटन में 330% से अधिक की वृद्धि हुई थी।

मशीन लर्निंग जॉब में आप अच्छा करियर बना सकते हैं। हमने सबसे अधिक पूछे जाने वाले मशीन लर्निंग साक्षात्कार प्रश्न और उत्तर नोट किए हैं। सुनिश्चित करें कि आप हमारे पूरे ब्लॉग को पढ़ते हैं ताकि आप मशीन लर्निंग साक्षात्कार के किसी भी प्रश्न और उत्तर को याद न करें।

शीर्ष मशीन लर्निंग साक्षात्कार प्रश्न और उत्तर

1. कृपया मशीन लर्निंग, आर्टिफिशियल इंटेलिजेंस और डीप लर्निंग के बारे में बताएं?

यंत्र अधिगम

मशीन लर्निंग को आर्टिफिशियल इंटेलिजेंस के सबसेट के रूप में परिभाषित किया गया है, और इसमें ऐसी तकनीकें शामिल हैं जो कंप्यूटर को डेटा से चीजों को छांटने और आर्टिफिशियल इंटेलिजेंस एप्लिकेशन देने में सक्षम बनाती हैं।

कृत्रिम होशियारी (एआई) कंप्यूटर विज्ञान की एक शाखा है जो मुख्य रूप से स्मार्ट मशीनों के निर्माण पर केंद्रित है जो कुछ ऐसे कार्य कर सकती हैं जिनमें मुख्य रूप से मानव बुद्धि की आवश्यकता होती है। यह मशीनों में मानव बुद्धि को दोहराने या अनुकरण करने का उपक्रम है।

डीप लर्निंग को आर्टिफिशियल इंटेलिजेंस में मशीन लर्निंग एल्गोरिदम के एक वर्ग के रूप में परिभाषित किया जा सकता है जो मुख्य रूप से दिए गए कच्चे इनपुट से उच्च-स्तरीय सुविधाओं को संचयी रूप से निकालने के लिए कई परतों का उपयोग करता है।

2. मशीन लर्निंग कितना मुश्किल है?

मशीन लर्निंग बहुत बड़ी है और इसमें बहुत सी चीजें शामिल हैं। इसलिए, यदि आप प्रति दिन कम से कम 6-7 घंटे खर्च करते हैं, तो मशीन लर्निंग सीखने में छह महीने से अधिक समय लगेगा। यदि आपके पास गणितीय और विश्लेषणात्मक कौशल अच्छा है, तो आपके लिए छह महीने पर्याप्त होंगे।

3. क्या आप SVM एल्गोरिथम में कर्नेल ट्रिक की व्याख्या कर सकते हैं?

कर्नेल ट्रिक एक ऐसी विधि है जहां गैर-रेखीय डेटा को एक बड़े आयाम स्थान पर पेश किया जाता है ताकि डेटा को वर्गीकृत करना आसान हो सके जहां इसे एक विमान द्वारा रैखिक रूप से विभाजित किया जा सके।

4. क्या आप कुछ लोकप्रिय क्रॉस-वेलिडेशन तकनीकों की सूची बना सकते हैं?

कुछ लोकप्रिय क्रॉस-सत्यापन तकनीकों को नीचे सूचीबद्ध किया गया है:

    होल्डआउट विधि:इस तरह की तकनीक प्रशिक्षण डेटा सेट के हिस्से को हटाकर और उस मॉडल को भेजकर काम करती है जिसे आवश्यक पूर्वानुमान प्राप्त करने के लिए शेष डेटा सेट पर प्रशिक्षित किया गया था।के-फोल्ड क्रॉस-सत्यापन:यहां, डेटा को k सबसेट में विभाजित किया जाता है ताकि हर बार, k सबसेट में से एक को सत्यापन सेट के रूप में उपयोग किया जा सके, और अन्य k-1 सबसेट को प्रशिक्षण सेट के रूप में उपयोग किया जा सके।स्तरीकृत के-फोल्ड क्रॉस-सत्यापन:यह असंतुलित डेटा पर काम करता है।लीव-पी-आउट क्रॉस-वैलिडेशन:यहां, हम n डेटा बिंदुओं में से प्रशिक्षण डेटा से p डेटा बिंदुओं को छोड़ देते हैं, फिर हम मॉडल को प्रशिक्षित करने के लिए n-p नमूनों का उपयोग करते हैं और सत्यापन सेट के लिए p बिंदुओं का उपयोग करते हैं।

5. बैगिंग और बूस्टिंग एल्गोरिदम के बीच अंतर?

ऊलजलूल का कपड़ा बढ़ाने
यह एक ऐसी विधि है जो एक ही प्रकार की भविष्यवाणियों को मिलाती है।यह एक ऐसी विधि है जो विभिन्न प्रकार की भविष्यवाणियों को मिलाती है।
यह विचरण को कम करता है, पूर्वाग्रह को नहींयह पूर्वाग्रह को कम करता है, विचरण को नहीं।
प्रत्येक मॉडल को समान भार प्राप्त होता हैप्रदर्शन के आधार पर मॉडलों का वजन किया जाता है।

मशीन लर्निंग साक्षात्कार प्रश्न और उत्तर

6. SVM में कर्नेल क्या होते हैं? क्या आप SVM में प्रयुक्त कुछ लोकप्रिय कर्नेल की सूची बना सकते हैं?

कर्नेल का उपयोग मूल रूप से गणितीय कार्यों को सेट करने के लिए किया जाता है जो डेटा में हेरफेर करने के लिए विंडो प्रदान करके सपोर्ट वेक्टर मशीन में उपयोग किए जाते हैं। कर्नेल फ़ंक्शन का उपयोग डेटा के प्रशिक्षण सेट को बदलने के लिए किया जाता है ताकि एक गैर-रैखिक निर्णय सतह को बड़ी संख्या में आयाम रिक्त स्थान में एक रैखिक समीकरण में बदल दिया जा सके।

SVM में उपयोग की जाने वाली कुछ लोकप्रिय गुठली हैं:

  1. बहुपद कर्नेल
  2. गाऊसी कर्नेल
  3. गाऊसी रेडियल बेसिस फंक्शन (आरबीएफ)
  4. लाप्लास आरबीएफ कर्नेल
  5. अतिपरवलयिक स्पर्शरेखा गिरी
  6. सिग्मॉइड कर्नेल
  7. पहली तरह के कर्नेल का बेसेल फंक्शन
  8. एनोवा रेडियल बेस कर्नेल

7. क्या आप OOB त्रुटि की व्याख्या कर सकते हैं?

ओबीबी त्रुटि नामक एक आउट-ऑफ-बैग त्रुटि, जिसे आउट-ऑफ-बैग अनुमान के रूप में भी जाना जाता है, यादृच्छिक वनों की भविष्यवाणी त्रुटि को मापने के लिए एक तकनीक है, निर्णय वृक्षों को बढ़ाया जाता है। बैगिंग मुख्य रूप से मॉडल से सीखने के लिए प्रशिक्षण नमूने बनाने के लिए प्रतिस्थापन के साथ सबसैंपलिंग का उपयोग करता है।

8. क्या आप के-मीन्स और केएनएन एल्गोरिदम के बीच अंतर कर सकते हैं?

कश्मीर साधन केएनएन एल्गोरिदम
यह बिना पर्यवेक्षित मशीन लर्निंग है।यह पर्यवेक्षित मशीन लर्निंग है।
यह एक क्लस्टरिंग मशीन लर्निंग एल्गोरिदम है।यह एक वर्गीकरण या प्रतिगमन मशीन लर्निंग एल्गोरिदम है।
इसका प्रदर्शन धीमा है।यह बहुत बेहतर प्रदर्शन करता है।
यह एक उत्सुक शिक्षार्थी है।यह एक आलसी शिक्षार्थी है।

9. वेरिएंस इन्फ्लेशन फैक्टर का मतलब समझाइए?

VIF के रूप में जाना जाने वाला वेरिएंस इन्फ्लेशन फैक्टर, दिए गए मल्टीपल रिग्रेशन वेरिएबल्स के सेट में मल्टीकोलिनियरिटी की मात्रा का एक माप है। यहां अनुपात की गणना प्रत्येक स्वतंत्र चर के लिए की जाती है। एक उच्च वीआईएफ का मतलब है कि संबंधित स्वतंत्र चर ज्यादातर मॉडल में अन्य चर के साथ मिलते-जुलते हैं।

10. मशीन लर्निंग में SVM (सपोर्ट वेक्टर मशीन) की व्याख्या करें?

सपोर्ट वेक्टर मशीन, जिसे एसवीएम के नाम से जाना जाता है, सबसे अधिक इस्तेमाल किए जाने वाले सुपरवाइज्ड लर्निंग एल्गोरिदम में से एक है जो मुख्य रूप से वर्गीकरण के साथ-साथ रिग्रेशन समस्याओं के लिए उपयोग किया जाता है। यह मुख्य रूप से मशीन लर्निंग में वर्गीकरण समस्याओं के लिए उपयोग किया जाता है।

यह सभी देखें शीर्ष 100 उत्तरदायी साक्षात्कार प्रश्न और उत्तर

एसवीएम एल्गोरिथम का मुख्य उद्देश्य सर्वोत्तम निर्णय सीमा बनाना है, जो एन-डायमेंशनल स्पेस को कक्षाओं में अलग करता है ताकि भविष्य में नए प्राप्त डेटा बिंदु को सही श्रेणी में आसानी से रखा जा सके।

मशीन लर्निंग साक्षात्कार प्रश्न और उत्तर

11. पर्यवेक्षित और अनुपयोगी मशीन लर्निंग के बीच अंतर करें?

पर्यवेक्षित मॉडल अनुपयोगी मॉडल
यहाँ, एल्गोरिथम एक लेबल किए गए डेटासेट पर सीखता है,यहां, यह बिना लेबल वाला डेटा प्रदान करता है।
यहां, मॉडल को मैपिंग फ़ंक्शन को खोजने की आवश्यकता होती है जिसका उपयोग आउटपुट वेरिएबल (Y) के साथ इनपुट वेरिएबल (X) को मैप करने के लिए किया जाता है।अनुपयोगी शिक्षण का मुख्य उद्देश्य दिए गए इनपुट डेटा से संरचना और पैटर्न का पता लगाना है।

12. प्रेसिजन और रिकॉल शब्दों की व्याख्या करें?

शुद्धता, सकारात्मक भविष्य कहनेवाला मूल्य के रूप में भी जाना जाता है, को पुनर्प्राप्त उदाहरणों के बीच प्रासंगिक उदाहरणों के अंश के रूप में परिभाषित किया गया है।

प्रेसिजन = टीपी / टीपी + एफपी

जहां टीपी सच सकारात्मक है

एफपी आईडी झूठी सकारात्मक

याद करो, संवेदनशीलता के रूप में भी जाना जाता है, जिसे पुनर्प्राप्त किए गए प्रासंगिक उदाहरणों के अंश के रूप में परिभाषित किया गया है।

रिकॉल = टीपी / टीपी + एफपी।

जहां टीपी सच सकारात्मक है

एफपी झूठी सकारात्मक है।

13. L1 और L2 नियमितीकरण के बीच अंतर करें?

L1 नियमितीकरण L2 नियमितीकरण
एक प्रतिगमन मॉडल जो L1 नियमितीकरण प्रक्रिया का उपयोग करता है उसे Lasso Regression कहा जाता है।एक प्रतिगमन मॉडल जो L1 नियमितीकरण प्रक्रिया का उपयोग करता है उसे रिज रिग्रेशन कहा जाता है।
लासो रिग्रेशन गुणांक के परिमाण के निरपेक्ष मान को हानि फ़ंक्शन में दंड अवधि के रूप में जोड़ता है।रिज रिग्रेशन, गुणांक के वर्ग परिमाण को हानि फ़ंक्शन में दंड अवधि के रूप में जोड़ता है।
यह डेटा के माध्यिका का अनुमान लगाने का प्रयास करता है।यह डेटा के माध्य का अनुमान लगाने की कोशिश करता है।

14. फूरियर रूपांतरण की व्याख्या करें?

फूरियर रूपांतरण किसी चीज़ को साइन तरंगों के एक समूह में विभाजित करने का एक तरीका है। गणित के संदर्भ में, द फूरियर ट्रांसफॉर्म एक ऐसी प्रक्रिया है जो एक सिग्नल को उसके संबंधित घटक घटकों और आवृत्तियों में बदल सकती है। फूरियर ट्रांसफॉर्म का उपयोग न केवल सिग्नल, रेडियो, ध्वनिक आदि में किया जाता है।

15. F1 स्कोर क्या है? इसका उपयोग कैसे करना है?

F1-स्कोर हार्मोनिक माध्य लेकर एक क्लासिफायरियर की सटीकता और रिकॉल दोनों को एक एकल मीट्रिक में जोड़ता है। इसका उपयोग दो क्लासिफायर के प्रदर्शन की तुलना करने के लिए किया जाता है। उदाहरण के लिए, क्लासिफायरियर X में उच्च रिकॉल है, और क्लासिफायर Y में उच्च परिशुद्धता है। अब दोनों क्लासिफायर के लिए गणना किए गए F1-स्कोर का उपयोग यह अनुमान लगाने के लिए किया जाएगा कि कौन बेहतर परिणाम देता है।

F1 स्कोर की गणना इस प्रकार की जा सकती है

2(पी*आर)/(पी+आर)

जहां पी परिशुद्धता है।

आर वर्गीकरण मॉडल का स्मरण है।

मशीन लर्निंग साक्षात्कार प्रश्न और उत्तर

16. टाइप I और टाइप II त्रुटि के बीच अंतर करें?

टाइप I एरर टाइप II एरर
यह एक झूठी सकारात्मक के बराबर है।यह एक गलत नकारात्मक के बराबर है
यह परिकल्पना की गैर-स्वीकृति को संदर्भित करता हैयह परिकल्पना की स्वीकृति को संदर्भित करता है
अधिकृत मैच के साथ भी अस्वीकृति हो सकती है।अनधिकृत मिलान के साथ भी स्वीकृति हो सकती है।

17. क्या आप समझा सकते हैं कि ROC वक्र कैसे कार्य करता है?

आरओसी वक्र को एफपीआर (झूठी सकारात्मक दर) के खिलाफ वास्तविक सकारात्मक दर (टीपीआर) की साजिश रचकर ग्राफिक रूप से दर्शाया जाता है। कहां

  1. वास्तविक धनात्मक दर को उन प्रेक्षणों के अनुपात के रूप में परिभाषित किया जा सकता है, जिन्हें दिए गए सभी सकारात्मक प्रेक्षणों में से सकारात्मक होने की भविष्यवाणी की गई है।

(टीपी/(टीपी + एफएन))

  1. झूठी-सकारात्मक दर को उन अवलोकनों के अनुपात के रूप में परिभाषित किया जाता है, जिन्हें सभी दिए गए नकारात्मक अवलोकनों में से गलत तरीके से सकारात्मक होने की भविष्यवाणी की जाती है।

(एफपी/(टीएन + एफपी))

18. डीप लर्निंग और मशीन लर्निंग के बीच अंतर करें?

ध्यान लगा के पढ़ना या सीखना यंत्र अधिगम
यह मशीन लर्निंग का एक सबसेट हैयह डीप लर्निंग का सुपरसेट है।
यह जटिल मुद्दों को हल करता है।इसका उपयोग नई चीजें सीखने के लिए किया जाता है।
यह मशीन लर्निंग के लिए एक विकास है।यह एआई का विकास है।
यहां, एल्गोरिदम बड़े पैमाने पर डेटा विश्लेषण पर स्व-चित्रित होते हैंडेटा विश्लेषकों द्वारा एल्गोरिदम का पता लगाया जाता है।

19. क्या आप विभिन्न मशीन लर्निंग एल्गोरिदम के नाम बता सकते हैं?

विभिन्न मशीन लर्निंग एल्गोरिदम नीचे सूचीबद्ध हैं:

  1. निर्णय के पेड़,
  2. नैव बेयस,
  3. यादृच्छिक वन
  4. समर्थन वेक्टर यंत्र
  5. K-निकटतम पड़ोसी,
  6. K- मतलब क्लस्टरिंग,
  7. गाऊसी मिश्रण मॉडल,
  8. हिडन मार्कोव मॉडल आदि।

मशीन लर्निंग साक्षात्कार प्रश्न और उत्तर

20. एआई क्या है?

तक

एआई (कृत्रिम बुद्धिमत्ता) मशीनों में मानव बुद्धि के अनुकरण को संदर्भित करता है जिसे मनुष्यों की तरह प्रतिबिंबित करने और उनके कार्यों की नकल करने के लिए प्रोग्राम किया जाता है।

उदाहरण: चेहरा पहचानना और पहचानना, Google मानचित्र, और

राइड-हेलिंग एप्लिकेशन, ई-पेमेंट्स।

मशीन लर्निंग साक्षात्कार प्रश्न और उत्तर

21. डेटा सेट पर काम करते समय महत्वपूर्ण चरों का चयन कैसे करें?

  1. महत्वपूर्ण चरों का चयन करने से पहले आपको सहसंबद्ध चरों को हटाना होगा।
  2. रैखिक समाश्रयण का उपयोग करें और उनके p मानों के आधार पर चरों का चयन करें।
  3. फॉरवर्ड सेलेक्शन, स्टेपवाइज सिलेक्शन और बैकवर्ड सिलेक्शन का इस्तेमाल करें।
  4. रैंडम फ़ॉरेस्ट, Xgboost, और प्लॉट वैरिएबल महत्व चार्ट का उपयोग करें
  5. लासो रिग्रेशन का प्रयोग करें
  6. आपको उपलब्ध सुविधाओं के सेट के लिए सूचना लाभ को मापकर शीर्ष n सुविधाओं का चयन करना होगा।

22. कार्य-कारण और सहसम्बन्ध में अंतर स्पष्ट कीजिए।

करणीय संबंध उन मामलों पर स्पष्ट रूप से लागू होता है जहां कार्रवाई ए कार्रवाई बी के परिणाम का कारण बनती है।

सह - संबंध बस एक रिश्ते के रूप में परिभाषित किया जा सकता है। जहां ए की क्रियाएं . के कार्यों से संबंधित हो सकती हैं बी। लेकिन यहां एक घटना के लिए दूसरी घटना का होना जरूरी नहीं है।

23. ओवरफिटिंग क्या है?

ओवरफिटिंग एक प्रकार की मॉडलिंग त्रुटि है जिसके परिणामस्वरूप भविष्य के अवलोकनों का प्रभावी ढंग से अनुमान लगाने या अनुमान लगाने या पहले से मौजूद मॉडल में अतिरिक्त डेटा फिट करने में विफलता होती है।

24. मानक विचलन और प्रसरण की शर्तों की व्याख्या करें?

प्रति मानक विचलन को उस संख्या के रूप में परिभाषित किया जाता है जो निर्दिष्ट करती है कि मान कितने फैले हुए हैं। एक निम्न मानक विचलन दर्शाता है कि अधिकांश संख्याएँ माध्य मान के करीब हैं। उच्च मानक विचलन का अर्थ है कि मान व्यापक श्रेणी में फैले हुए हैं।

झगड़ा मशीन लर्निंग में एक प्रकार की त्रुटि है जो दिए गए प्रशिक्षण सेट में छोटे उतार-चढ़ाव के प्रति मॉडल की संवेदनशीलता के कारण होती है।

25. मल्टीलेयर परसेप्ट्रॉन और बोल्ट्जमैन मशीन की व्याख्या करें?

एक बहुपरत परसेप्ट्रॉन (एमएलपी) कृत्रिम तंत्रिका नेटवर्क के एक वर्ग के रूप में परिभाषित किया गया है जो दिए गए इनपुट के सेट से आउटपुट का एक सेट उत्पन्न कर सकता है। एक एमएलपी में इनपुट नोड्स की कई परतें होती हैं जो इनपुट और आउटपुट परतों के बीच एक निर्देशित ग्राफ के रूप में जुड़ी होती हैं।

का मुख्य उद्देश्य बोल्ट्जमैन मशीन किसी दी गई समस्या के समाधान का अनुकूलन करना है। इसका उपयोग मुख्य रूप से उस निर्दिष्ट समस्या से संबंधित वजन और मात्रा को अनुकूलित करने के लिए किया जाता है।

मशीन लर्निंग साक्षात्कार प्रश्न और उत्तर

26. पूर्वाग्रह शब्द की व्याख्या करें?

मशीन लर्निंग में डेटा पूर्वाग्रह को एक प्रकार की त्रुटि के रूप में परिभाषित किया जाता है, जहां किसी दिए गए डेटासेट के कुछ तत्वों को दूसरों की तुलना में अधिक भारित किया जाता है। एक पक्षपाती डेटासेट मॉडल के उपयोग के मामले का सटीक रूप से प्रतिनिधित्व नहीं करेगा, और इसके परिणामस्वरूप कम सटीकता स्तर और विश्लेषणात्मक त्रुटियां होती हैं।

27. मशीन लर्निंग के प्रकारों के नाम बताएं?

मशीन लर्निंग के प्रकार नीचे सूचीबद्ध हैं:

  1. पर्यवेक्षित अध्ययन
  2. अनुपयोगी शिक्षा
  3. सुदृढीकरण सीखना

28. वर्गीकरण और प्रतिगमन के बीच अंतर?

वर्गीकरण वापसी
यह एक लेबल की भविष्यवाणी करने के बारे में हैयह एक मात्रा की भविष्यवाणी करने के बारे में है
यहां, डेटा को एक या एकाधिक वर्गों में लेबल किया जाता है।यहां, आपको लगातार मात्रा का अनुमान लगाने की आवश्यकता है।
यह एक सतत मूल्य की भविष्यवाणी कर सकता है।यह एक असतत मूल्य की भविष्यवाणी कर सकता है।
सटीकता का उपयोग करके इसका मूल्यांकन किया जा सकता है।इसका मूल्यांकन मूल माध्य चुकता त्रुटि का उपयोग करके किया जा सकता है।

29. एक भ्रम मैट्रिक्स क्या है?

मशीन लर्निंग के क्षेत्र में, a असमंजस का जाल एक त्रुटि मैट्रिक्स भी कहा जाता है, एक विशिष्ट तालिका लेआउट के रूप में परिभाषित किया जाता है जो उपयोगकर्ता को एल्गोरिदम के प्रदर्शन की कल्पना करने की अनुमति देता है, मुख्य रूप से एक पर्यवेक्षित सीखने वाला।

असमंजस का जाल

30. जब आपका डेटासेट उच्च विचरण से पीड़ित है, तो आप इसे कैसे संभालेंगे?

उच्च विचरण वाले डेटासेट के लिए, हम बैगिंग एल्गोरिथम का उपयोग कर सकते हैं। बैगिंग एल्गोरिदम डेटा को अलग-अलग उपसमूहों में विभाजित करता है, जिसमें नमूना यादृच्छिक डेटा से दोहराया जाता है। एक बार डेटा विभाजित हो जाने के बाद, एक प्रशिक्षण एल्गोरिथ्म का उपयोग करके, नियम बनाने के लिए यादृच्छिक डेटा का उपयोग किया जा सकता है। फिर हम मॉडल के सभी अनुमानित परिणामों को इकट्ठा करने के लिए मतदान तकनीक का उपयोग करते हैं।

मशीन लर्निंग साक्षात्कार प्रश्न और उत्तर

31. आगमनात्मक और निगमनात्मक अधिगम में अंतर स्पष्ट कीजिए।

आगमनात्मक शिक्षा डिडक्टिव लर्निंग
इसका उद्देश्य एक सिद्धांत विकसित करना है।इसका उद्देश्य एक मौजूदा सिद्धांत का परीक्षण करना है।
यह विशिष्ट टिप्पणियों से व्यापक सामान्यीकरण की ओर बढ़ता हैयदि कोई सिद्धांत नहीं है, तो आप निगमनात्मक शोध नहीं कर सकते।
इसमें तीन चरण होते हैं,अवलोकनएक पैटर्न का निरीक्षण करेंएक सिद्धांत विकसित करेंइसमें चार चरण होते हैं: मौजूदा सिद्धांत से शुरू करें मौजूदा सिद्धांत के आधार पर एक परिकल्पना तैयार करें परिकल्पना का परीक्षण करने के लिए डेटा एकत्र करें परिणामों का विश्लेषण करें

32. दिए गए डेटासेट में दूषित मानों की हैंडलिंग की व्याख्या करें?

लापता डेटा को संभालने के तरीके नीचे दिए गए हैं?

  1. अनुपलब्ध मानों वाली पंक्तियों को हटा दें।
  2. एक और भविष्य कहनेवाला मॉडल बनाएं ताकि आप लापता मूल्यों की भविष्यवाणी कर सकें।
  3. एक मॉडल का इस तरह से उपयोग करें कि वह लापता डेटा को शामिल कर सके।
  4. आपको अनुपलब्ध डेटा को समेकित मानों से बदलना होगा।
  5. आप लापता मूल्यों की भविष्यवाणी कर सकते हैं।
  6. एक अज्ञात श्रेणी बनाएं

33. इनमें से कौन अधिक महत्वपूर्ण मॉडल सटीकता या मॉडल प्रदर्शन है?

मॉडल सटीकता मशीनी भाषा/एआई मॉडल की महत्वपूर्ण विशेषता के रूप में माना जाता है। जब भी हम मॉडल के प्रदर्शन पर चर्चा करते हैं, तो हम पहले स्पष्ट करते हैं कि यह मॉडल स्कोरिंग प्रदर्शन है या मॉडल प्रशिक्षण प्रदर्शन।

मॉडल प्रदर्शन वितरित कंप्यूटिंग का उपयोग करके और दी गई स्कोर की गई संपत्तियों को समानांतर करके बेहतर बनाया गया है, लेकिन हमें मॉडल प्रशिक्षण प्रक्रिया के दौरान सावधानीपूर्वक सटीकता का निर्माण करने की आवश्यकता है।

34. एक समय श्रृंखला क्या है?

मशीन लर्निंग में समय श्रृंखला को यादृच्छिक चर के एक सेट के रूप में परिभाषित किया जाता है जिसे समय के संबंध में क्रमबद्ध किया जाता है। एक घटना की व्याख्या करने, एक प्रवृत्ति, चक्रीयता के घटकों की पहचान करने और इसके भविष्य के मूल्यों की भविष्यवाणी करने के लिए समय श्रृंखला का अध्ययन किया जाता है।

35. एन्ट्रॉपी और सूचना लाभ के बीच अंतर करें?

सूचना लाभ एक संकेत या यादृच्छिक चर के बारे में किसी अन्य यादृच्छिक चर को देखने से प्राप्त जानकारी की मात्रा के रूप में परिभाषित किया गया है।

एन्ट्रापी औसत दर के रूप में परिभाषित किया जा सकता है जिस पर डेटा के स्टोकेस्टिक स्रोत द्वारा जानकारी का उत्पादन किया जाता है, या इसे अनिश्चितता के माप के रूप में परिभाषित किया जा सकता है जो एक यादृच्छिक चर से जुड़ा होता है।

36. स्टोकेस्टिक ग्रैडिएंट डिसेंट (SGD) और ग्रैडिएंट डिसेंट (GD) के बीच अंतर करें?

बैच ग्रेडिएंट डिसेंट प्रत्येक चरण के पूर्ण प्रशिक्षण सेट पर गणना में शामिल होता है, जिसके परिणामस्वरूप बहुत बड़े प्रशिक्षण डेटा पर बहुत धीमी प्रक्रिया होती है। इसलिए बैच जीडी करना बहुत महंगा हो जाता है। हालांकि, यह कई गुना अपेक्षाकृत चिकनी त्रुटि के लिए बहुत अच्छा है। इसके अलावा, यह सुविधाओं की संख्या के साथ अच्छी तरह से स्केल करता है।

स्टोकेस्टिक ग्रेडिएंट डिसेंट बैच ग्रेडिएंट डिसेंट में प्राथमिक समस्या को हल करने का प्रयास करता है जो कि प्रत्येक चरण के रूप में ग्रेडिएंट की गणना करने के लिए संपूर्ण प्रशिक्षण डेटा का उपयोग होता है। SGD प्रकृति में स्टोकेस्टिक है, जिसका अर्थ है कि यह प्रत्येक चरण में प्रशिक्षण डेटा के कुछ यादृच्छिक उदाहरण उठाता है, और फिर यह ग्रेडिएंट की गणना करता है जिससे यह तेज़ हो जाता है क्योंकि एक शॉट में हेरफेर करने के लिए बहुत कम डेटा होता है,

बैच ग्रेडिएंट डिसेंट स्टोकेस्टिक ग्रेडिएंट डिसेंट
यह संपूर्ण प्रशिक्षण नमूने का उपयोग करके ग्रेडिएंट की गणना करता है।यह एकल प्रशिक्षण नमूने का उपयोग करके ढाल की गणना करता है।
बड़े प्रशिक्षण नमूनों के लिए इसका सुझाव नहीं दिया जा सकता है।यह बड़े प्रशिक्षण नमूनों के लिए सुझाया जा सकता है।
यह प्रकृति में नियतात्मक है।यह प्रकृति में परिष्कृत है।

37. डिसीजन ट्री में गिनी अशुद्धता और एन्ट्रॉपी के बीच अंतर करें?

गिनी एन्ट्रापी
अंतराल के अंदर इसके मान हैं [0, 0.5]अंतराल के अंदर इसके मान हैं [0, 1]
यह अधिक जटिल है।यह जटिल नहीं है।
इसका माप एक यादृच्छिक नमूने की संभावना है जिसे सही ढंग से वर्गीकृत किया जा रहा है।यह जानकारी की कमी की गणना करने के लिए एक माप है,

38 . डिसीजन ट्री के कुछ फायदे और नुकसान का उल्लेख करें?

निर्णय वृक्षों के फायदे और नुकसान

निर्णय वृक्ष के लाभ:

  1. अन्य एल्गोरिदम की तुलना में पूर्व-प्रसंस्करण के दौरान डेटा तैयार करने के लिए निर्णय पेड़ों को कम प्रयास की आवश्यकता होती है।
  2. निर्णय वृक्ष को डेटा के सामान्यीकरण की आवश्यकता नहीं होती है।
  3. इसके लिए डेटा स्केलिंग की आवश्यकता नहीं होती है।
  4. डेटा में गुम मान निर्णय ट्री बनाने की प्रक्रिया को प्रभावित नहीं करते हैं।
  5. तकनीकी टीमों और हितधारकों को डिसीजन ट्री मॉडल समझाना बहुत आसान है।
यह सभी देखें शीर्ष 100 जावास्क्रिप्ट साक्षात्कार प्रश्न और उत्तर

39. क्या आप मशीन लर्निंग में एन्सेम्बल लर्निंग तकनीक की व्याख्या कर सकते हैं?

एन्सेम्बल विधियाँ ऐसी तकनीकें हैं जिनका उपयोग कई मॉडल बनाने और उन्हें बेहतर परिणाम देने के लिए संयोजित करने के लिए किया जाता है। एसेंबल विधियाँ आमतौर पर एकल मॉडल की तुलना में अधिक सटीक समाधान उत्पन्न करती हैं।

में सीखने को इकट्ठा करो , हम प्रशिक्षण डेटा सेट को कई सबसेट में विभाजित करते हैं, जहां प्रत्येक सबसेट का उपयोग एक अलग मॉडल बनाने के लिए किया जाता है। एक बार जब मॉडल प्रशिक्षित हो जाते हैं, तो उन्हें परिणाम की भविष्यवाणी करने के लिए इस तरह से जोड़ा जाता है कि आउटपुट के विचरण में कमी आती है।

मशीन लर्निंग साक्षात्कार प्रश्न और उत्तर

40. कोलीनियरिटी और मल्टीकोलीनियरिटी शब्दों की व्याख्या करें?

multicollinearity तब होता है जब एक प्रतिगमन मॉडल में कई स्वतंत्र चर एक दूसरे के साथ अत्यधिक सहसंबद्ध होते हैं, जिसका अर्थ है कि एक स्वतंत्र चर की भविष्यवाणी एक प्रतिगमन मॉडल के अंदर दूसरे स्वतंत्र चर से की जा सकती है।

समरैखिकता मुख्य रूप से तब होता है जब एक बहु प्रतिगमन में दो भविष्यवक्ता चर में कुछ सहसंबंध होता है।

समरैखिकता

41. रैंडम फ़ॉरेस्ट और ग्रैडिएंट बूस्टिंग मशीनों के बीच अंतर करें?

यादृच्छिक वनों की तरह, ग्रेडिएंट बूस्टिंग भी निर्णय वृक्षों का एक समूह है। दो प्राथमिक अंतर हैं:

    पेड़ कैसे बनते हैं:रैंडम फ़ॉरेस्ट में प्रत्येक पेड़ स्वतंत्र रूप से बनाया गया है, जबकि ग्रेडिएंट बूस्टिंग एक समय में केवल एक पेड़ बनाता है।संयोजन परिणाम: यादृच्छिक वन औसत से प्रक्रिया के अंत में परिणाम जोड़ते हैं। जबकि ग्रेडिएंट बूस्टिंग पथ के साथ परिणामों को जोड़ती है।

42. Eigenvectors और Eigenvalues ​​शब्दों की व्याख्या करें?

आइजनवेक्टर इकाई सदिश हैं, जिसका अर्थ है कि उनकी लंबाई या परिमाण 1.0 के बराबर है। उन्हें सही वैक्टर कहा जाता है, जिसका अर्थ है एक कॉलम वेक्टर।

स्वदेशी मूल्य वे गुणांक हैं जो eigenvectors पर लागू होते हैं, जो बदले में, वैक्टर को उनकी लंबाई या परिमाण देते हैं।

Eigenvectors और Eigenvalues

43. क्या आप सहयोगी नियम खनन (एआरएम) की व्याख्या कर सकते हैं?

एसोसिएशन नियम खनन (एआरएम) का उद्देश्य एसोसिएशन के नियमों का पता लगाना है जो एक डेटाबेस से पूर्वनिर्धारित न्यूनतम समर्थन और विश्वास को संतुष्ट करेगा। AMO का उपयोग मुख्य रूप से नए फिटनेस फ़ंक्शंस के साथ संबद्धता नियमों की संख्या को कम करने के लिए किया जाता है जो लगातार नियमों को शामिल कर सकते हैं।

44. ए/बी परीक्षण क्या है?

A/B परीक्षण को एक बुनियादी यादृच्छिक नियंत्रण प्रयोग के रूप में परिभाषित किया गया है। इसका उपयोग चर के दो संस्करणों की तुलना करने के लिए किया जाता है ताकि यह पता लगाया जा सके कि उनमें से कौन एक नियंत्रित वातावरण में बेहतर प्रदर्शन करता है।

दो मॉडलों की तुलना करने के लिए ए/बी परीक्षण का सबसे अच्छा उपयोग किया जा सकता है ताकि यह जांचा जा सके कि ग्राहक के लिए सबसे अच्छा अनुशंसित उत्पाद कौन सा है।

45. हाशियाकरण और इसकी प्रक्रिया की व्याख्या करें?

हाशियाकरण एक ऐसी विधि है जिसमें दूसरे चर के सीमांत योगदान को निर्धारित करने के लिए एक चर के संभावित मूल्यों के योग की आवश्यकता होती है।

पी (एक्स = एक्स) = ∑YP (एक्स = एक्स, वाई)

मशीन लर्निंग साक्षात्कार प्रश्न और उत्तर

46. ​​क्लस्टर नमूनाकरण क्या है?

क्लस्टरिंग

चुननेवाली मेडिकल जांच नमूनाकरण विधि के एक प्रकार के रूप में परिभाषित किया गया है। क्लस्टर सैंपलिंग के साथ, शोधकर्ता आमतौर पर आबादी को अलग-अलग समूहों या सेटों में विभाजित करते हैं, जिन्हें क्लस्टर के रूप में जाना जाता है। फिर, जनसंख्या से समूहों का एक यादृच्छिक नमूना लिया जाता है। फिर शोधकर्ता एकत्रित नमूना समूहों से डेटा पर अपना विश्लेषण करता है।

47. आयाम के अभिशाप की व्याख्या करें?

आयामीता का अभिशाप मूल रूप से सुविधाओं की संख्या में वृद्धि के साथ त्रुटि में वृद्धि को संदर्भित करता है। यह इस तथ्य को संदर्भित किया जा सकता है कि एल्गोरिदम उच्च आयामों में डिजाइन करने के लिए जोरदार हैं, और उनके पास अक्सर आयामों में चलने का समय घातीय होता है।

48. क्या आप डेटा विश्लेषण और वैज्ञानिक संगणना के लिए उपयोग किए जाने वाले पायथन में कुछ पुस्तकालयों के नाम बता सकते हैं?

  1. Numpy
  2. विज्ञानपी
  3. पांडा
  4. विज्ञान किट
  5. माटप्लोटलिब
  6. सीबॉर्न
  7. bokeh

49. आउटलेयर क्या हैं? आउटलेर्स से निपटने के तरीकों का उल्लेख करें?

एक बाहरी को एक ऐसी वस्तु के रूप में परिभाषित किया जा सकता है जो अन्य वस्तुओं से महत्वपूर्ण रूप से विचलित होती है। वे निष्पादन त्रुटियों के कारण हो सकते हैं।

आउटलेर्स से निपटने के तीन मुख्य तरीके इस प्रकार हैं:

  1. यूनीवेरिएट विधि
  2. बहुभिन्नरूपी विधि
  3. मिंकोव्स्की त्रुटि

50. परिदृश्यों के साथ कुछ लोकप्रिय वितरण वक्रों की सूची बनाएं जहां आप उनका उपयोग एल्गोरिदम में करेंगे?

सबसे लोकप्रिय वितरण वक्र हैं:

वर्दी वितरण एक संभाव्यता वितरण के रूप में परिभाषित किया जा सकता है जिसमें निरंतर संभावना होती है। उदाहरण: एक पासे को उछालना क्योंकि उसके अनेक परिणाम होते हैं।

द्विपद वितरण केवल दो संभावित परिणामों के साथ एक संभावना के रूप में परिभाषित किया गया है। उदाहरण: एक सिक्का उछालना। परिणाम या तो सिर या पूंछ होगा।

सामान्य वितरण निर्दिष्ट करता है कि चर के मान कैसे वितरित किए जाते हैं। उदाहरण: कक्षा में छात्रों की ऊंचाई।

मछली वितरण विशिष्ट घटनाओं की संभावना का अनुमान लगाने में मदद करता है जो तब हो रही हैं जब आप जानते हैं कि वह घटना कितनी बार हुई है।

घातीय वितरण विशिष्ट घटना घटित होने तक मुख्य रूप से समय की मात्रा से संबंधित है। उदाहरण: कार की बैटरी कितने महीनों में चल सकती है।

मशीन लर्निंग साक्षात्कार प्रश्न और उत्तर

51. क्या आप रेखीय समाश्रयण से शुरू करने से पहले प्राप्त किए जाने वाले डेटा के लिए मान्यताओं को सूचीबद्ध कर सकते हैं?

जिन मान्यताओं को पूरा किया जाना है वे हैं:

  1. रैखिक संबंध
  2. बहुभिन्नरूपी सामान्यता
  3. नहीं या थोड़ा बहुसंकेतन
  4. कोई ऑटो-सहसंबंध नहीं
  5. समलैंगिकता

52. वेरिएंस इन्फ्लेशन फैक्टर का अर्थ समझाएं?

वेरिएंस इन्फ्लेशन फैक्टर जो कि VIF है, को कई रिग्रेशन वैरिएबल के दिए गए सेट में मल्टीकोलिनियरिटी की मात्रा के माप के रूप में परिभाषित किया गया है।

गणितीय रूप से, एक प्रतिगमन मॉडल चर के लिए प्रसरण मुद्रास्फीति कारक अंतिम मॉडल विचरण के अनुपात के बराबर है जिसमें एक मॉडल का विचरण होता है जिसमें वह एकल स्वतंत्र चर शामिल होता है।

इस अनुपात की गणना प्रत्येक स्वतंत्र चर के लिए की जाती है। एक उच्च वीआईएफ दर्शाता है कि संबंधित स्वतंत्र चर मॉडल में अन्य चर के साथ बेहद मेल खाते हैं।

53. क्या आप हमें बता सकते हैं कि रैखिक प्रतिगमन रेखा कब घूमना बंद कर देती है या एक इष्टतम स्थान ढूंढती है जहां इसे डेटा पर फिट किया जाता है?

वह स्थान जहाँ उच्चतम RSquared मान पाया जाता है, जहाँ रेखा विरामावस्था में आती है। RSquared आमतौर पर वर्चुअल लीनियर रिग्रेशन लाइन द्वारा कैप्चर किए गए विचरण की मात्रा का प्रतिनिधित्व करता है w.r.t डेटासेट द्वारा कैप्चर किए गए कुल विचरण।

54. क्या आप हमें बता सकते हैं कि किस मशीन लर्निंग एल्गोरिदम को आलसी सीखने वाले के रूप में जाना जाता है और इसे ऐसा क्यों कहा जाता है?

KNN मशीन लर्निंग एल्गोरिदम को आलसी शिक्षार्थी कहा जाता है। K-NN को एक आलसी शिक्षार्थी के रूप में परिभाषित किया गया है क्योंकि यह दिए गए प्रशिक्षण डेटा से कोई मशीन-सीखा मूल्य या चर नहीं सीखेगा, लेकिन गतिशील रूप से यह हर बार वर्गीकृत करने के लिए दूरी की गणना करता है। इसलिए यह इसके बजाय प्रशिक्षण डेटासेट को याद रखता है।

55. क्या आप हमें बता सकते हैं कि क्या समस्या हो सकती है जब एक विशिष्ट चर के लिए बीटा मान प्रत्येक उपसमुच्चय में बहुत अधिक भिन्न होता है जब डेटासेट के विभिन्न उपसमुच्चय पर प्रतिगमन चलाया जाता है?

प्रत्येक उपसमुच्चय में बीटा मानों में भिन्नता बताती है कि डेटासेट विषम है। इस समस्या को दूर करने के लिए, हम दिए गए डेटासेट के क्लस्टर किए गए सबसेट में से प्रत्येक के लिए एक अलग मॉडल का उपयोग करते हैं, या हम एक गैर-पैरामीट्रिक मॉडल जैसे निर्णय पेड़ का उपयोग करते हैं।

56. प्रशिक्षण सेट डेटा आकार के आधार पर क्लासिफायरियर कैसे चुनें?

यदि प्रशिक्षण सेट आकार में छोटा है, उच्च पूर्वाग्रह या कम विचरण मॉडल, उदाहरण के लिए, Naive Bayes बेहतर प्रदर्शन करता है क्योंकि उनके ओवरफिट होने की संभावना कम होती है।

यदि प्रशिक्षण सेट आकार में बड़ा है, तो कम पूर्वाग्रह या उच्च विचरण मॉडल, उदाहरण के लिए, लॉजिस्टिक रिग्रेशन, बेहतर प्रदर्शन करते हैं क्योंकि वे अधिक जटिल संबंधों को प्रतिबिंबित कर सकते हैं।

57. मशीन लर्निंग मॉडल में प्रशिक्षण सेट और टेस्ट सेट के बीच अंतर करें?

प्रशिक्षण सेट टेस्ट सेट
कुल डेटा का 70% प्रशिक्षण डेटासेट के रूप में लिया जाता है।शेष 30% को परीक्षण डेटासेट के रूप में लिया जाता है।
इसे एक मॉडल बनाने के लिए लागू किया गया है।इसका उपयोग निर्मित मॉडल को मान्य करने के लिए किया जाता है।
यह एक लेबल वाला डेटा है जिसका उपयोग मॉडल को प्रशिक्षित करने के लिए किया जाता है।हम आमतौर पर लेबल किए गए डेटा के बिना परीक्षण करते हैं और फिर लेबल के साथ परिणामों को सत्यापित करते हैं।

58. एक झूठी सकारात्मक और झूठी नकारात्मक की व्याख्या करें और वे कैसे महत्वपूर्ण हैं?

प्रति सकारात्मक झूठी एक अवधारणा है जहां आप किसी दिए गए परीक्षण के लिए सकारात्मक परिणाम प्राप्त करते हैं जब आपको वास्तव में नकारात्मक परिणाम प्राप्त करना चाहिए था। इसे गलत अलार्म या झूठी सकारात्मक त्रुटि भी कहा जाता है। यह मूल रूप से चिकित्सा क्षेत्र में उपयोग किया जाता है, लेकिन यह सॉफ्टवेयर परीक्षण पर भी लागू हो सकता है।

झूठी सकारात्मक के उदाहरण:

  1. एक गर्भावस्था परीक्षण सकारात्मक है, जहां वास्तव में, आप गर्भवती नहीं हैं।
  2. एक कैंसर स्क्रीनिंग टेस्ट सकारात्मक है, लेकिन आपको यह बीमारी नहीं है।
  3. जब आपके भ्रूण में कोई विकार नहीं होता है तो डाउन सिंड्रोम के लिए प्रसव पूर्व परीक्षण सकारात्मक होते हैं।
  4. आपके सिस्टम पर वायरस सॉफ़्टवेयर एक हानिरहित प्रोग्राम को दुर्भावनापूर्ण प्रोग्राम के रूप में गलत तरीके से पहचानता है।

प्रति मिथ्या नकारात्मक परिभाषित किया गया है जहां एक नकारात्मक परीक्षा परिणाम गलत है। सरल शब्दों में, आपको एक नकारात्मक परीक्षा परिणाम मिलता है, जहाँ आपको एक सकारात्मक परीक्षा परिणाम मिलना चाहिए था।

उदाहरण के लिए, गर्भावस्था परीक्षण लेने पर विचार करें, और आप नकारात्मक (गर्भवती नहीं) के रूप में परीक्षण करते हैं। लेकिन वास्तव में, आप गर्भवती हैं।

झूठी नकारात्मक गर्भावस्था परीक्षण के परिणाम बहुत जल्दी परीक्षण करने, पतला मूत्र का उपयोग करने, या बहुत जल्द परिणामों की जांच करने के कारण होते हैं। लगभग हर चिकित्सा परीक्षण में झूठी नकारात्मकता का जोखिम होता है।

59. अर्ध-पर्यवेक्षित मशीन लर्निंग शब्द की व्याख्या करें?

अर्ध-पर्यवेक्षित शिक्षण को मशीन सीखने के लिए एक दृष्टिकोण के रूप में परिभाषित किया गया है जो प्रशिक्षण प्रक्रिया के दौरान बड़ी मात्रा में लेबल रहित डेटा के साथ लेबल किए गए डेटा की कम मात्रा को जोड़ता है। यह पर्यवेक्षित शिक्षण और पर्यवेक्षित शिक्षण के बीच आता है।

60. क्या आप हमें आधुनिक व्यवसायों में पर्यवेक्षित मशीन लर्निंग के अनुप्रयोग बता सकते हैं?

  1. स्वास्थ्य निदान
  2. धोखाधड़ी का पता लगाना
  3. ईमेल स्पैम का पता लगाना
  4. भावनात्मक विश्लेषण

61. क्या आप इंडक्टिव मशीन लर्निंग और डिडक्टिव मशीन लर्निंग में अंतर कर सकते हैं?

आगमनात्मक मशीन लर्निंग डिडक्टिव मशीन लर्निंग
ए ⋀ बी ⊢ ए → बी (प्रेरण)ए (ए -> बी) ⊢ बी (कटौती)
यह उदाहरणों के सेट से देखता है और सीखता है, और फिर यह निष्कर्ष निकालता है।यह पहले निष्कर्ष निकालता है, और फिर पिछले निर्णय के आधार पर उस पर काम करता है।
यह KNN या SVM की तरह एक सांख्यिकीय मशीन लर्निंग है,डिसीजन ट्री का उपयोग करके डिडक्टिव रीजनिंग के लिए मशीन लर्निंग एल्गोरिदम।

62. मशीन लर्निंग में रैंडम फ़ॉरेस्ट क्या है?

यादृच्छिक वन को एक पर्यवेक्षित शिक्षण एल्गोरिथ्म के रूप में परिभाषित किया जा सकता है जिसका उपयोग वर्गीकरण और प्रतिगमन के लिए किया जाता है। इसी तरह, रैंडम फ़ॉरेस्ट एल्गोरिथम डेटा नमूनों पर निर्णय ट्री बनाता है, और फिर यह प्रत्येक नमूने से भविष्यवाणी प्राप्त करता है और अंत में मतदान के माध्यम से सर्वश्रेष्ठ का चयन करता है।

63. बायस और वेरिएंस के बीच ट्रेड-ऑफ की व्याख्या करें?

पक्षपात के रूप में परिभाषित किया जा सकता है लक्ष्य फ़ंक्शन को अनुमानित करने में आसान बनाने के लिए मॉडल द्वारा की गई धारणाएं।

झगड़ा विभिन्न प्रशिक्षण डेटा को देखते हुए लक्ष्य फ़ंक्शन का अनुमान बदल जाएगा कि राशि के रूप में परिभाषित किया गया है।

अदला - बदली पूर्वाग्रह और विचरण द्वारा शुरू की गई त्रुटि के बीच तनाव के रूप में परिभाषित किया गया है।

64. डिसीजन ट्री में प्रूनिंग के बारे में बताएं, और यह कैसे किया जाता है?

प्रूनिंग मशीन लर्निंग और सर्च एल्गोरिदम में एक डेटा कंप्रेशन प्रक्रिया है जो पेड़ के कुछ हिस्सों को हटाकर निर्णय पेड़ों के आकार को कम कर सकती है जो उदाहरणों को वर्गीकृत करने के लिए गैर-महत्वपूर्ण और अनावश्यक हैं। एक पेड़ जो प्रशिक्षण डेटा से अधिक जोखिम भरा है और नए नमूनों के लिए खराब सामान्यीकरण कर रहा है।

छंटाई निम्नानुसार की जा सकती है।

  1. टॉप-डाउन फैशन (यह नोड्स की यात्रा करेगा और रूट से शुरू होने वाले सबट्री को ट्रिम करेगा)
  2. बॉटम-अप फैशन (यह लीफ नोड्स पर शुरू होगा)

हमने निर्णय पेड़ों की छंटाई के लिए त्रुटि एल्गोरिथ्म को कम कर दिया है।

65. डिसीजन ट्री में प्रूनिंग के लिए कम त्रुटि वाले एल्गोरिदम कैसे काम करते हैं?

कम त्रुटि एल्गोरिथ्म निम्नानुसार काम करता है:

  1. यह प्रूनिंग के लिए प्रत्येक नोड पर विचार करता है।
  2. Pruning = उस नोड पर सबट्री को हटाना, फिर इसे एक पत्ता बनाना और उस नोड पर प्रमुख सामान्य वर्ग असाइन करना।
  3. पेड़ से एक नोड हटा दिया जाता है यदि परिणामी पेड़ मूल से भी बदतर प्रदर्शन करता है।
  4. नोड्स को इस तरह से चुनकर पुनरावृत्त रूप से हटा दिया जाता है कि जिनके हटाने से ग्राफ़ पर निर्णय वृक्ष की सटीकता बढ़ जाती है।
  5. प्रूनिंग तब तक जारी रहती है जब तक कि आगे की छंटाई हानिकारक न हो।
  6. यह प्रशिक्षण, परीक्षण सेट और सत्यापन का उपयोग करता है। यदि बड़ी मात्रा में डेटा उपलब्ध है तो यह एक प्रभावी तरीका है।
यह सभी देखें शीर्ष 100 जावास्क्रिप्ट साक्षात्कार प्रश्न और उत्तर

66. निर्णय वृक्ष वर्गीकरण शब्द की व्याख्या करें?

एक डिसीजन ट्री एक ट्री स्ट्रक्चर के रूप में वर्गीकरण मॉडल बनाता है, जिसमें डिसीजन ट्री विकसित करते समय डेटासेट छोटे उपसमुच्चय में टूट जाता है; मूल रूप से, यह एक पेड़ जैसा तरीका है जिसमें शाखाओं और नोड्स को परिभाषित किया गया है। निर्णय वृक्ष श्रेणीबद्ध और संख्यात्मक डेटा दोनों को संभालते हैं।

67. लॉजिस्टिक रिग्रेशन की व्याख्या करें?

लॉजिस्टिक रिग्रेशन विश्लेषण एक ऐसी तकनीक है जिसका उपयोग एक द्विबीजपत्री आश्रित चर के साथ स्वतंत्र चर के जुड़ाव की जांच करने के लिए किया जाता है। यह रैखिक प्रतिगमन विश्लेषण के विपरीत है, जहां आश्रित चर एक सतत चर है।

हर बार लॉजिस्टिक रिग्रेशन का आउटपुट 0.5 के थ्रेशोल्ड वैल्यू के साथ 0 या 1 होता है। 0.5 से ऊपर के किसी भी मान को 1 के रूप में लिया जाता है और 0.5 से नीचे के किसी भी बिंदु को 0 के रूप में लिया जाता है।

68. आयामीता को कम करने के कुछ तरीकों के नाम बताएं?

आयामीता को कम करने की कुछ विधियाँ नीचे दी गई हैं:

  1. फीचर इंजीनियरिंग के साथ सुविधाओं को मिलाकर
  2. कोलीनियर सुविधाओं को हटाना
  3. एल्गोरिथम आयामीता में कमी का उपयोग करना।

69. एक सिफारिश प्रणाली क्या है?

अनुशंसा प्रणाली मुख्य रूप से ग्राहक डेटा एकत्र करती है और ग्राहकों के लिए अनुकूलित अनुशंसाएं उत्पन्न करने के लिए इस डेटा का स्वतः विश्लेषण करती है। ये सिस्टम मुख्य रूप से अंतर्निहित डेटा जैसे ब्राउज़िंग इतिहास और हाल की खरीदारी और ग्राहक द्वारा प्रदान की गई रेटिंग जैसे स्पष्ट डेटा पर निर्भर करते हैं।

मशीन सीखने के प्रश्न - सिफारिश प्रणाली

70. K निकटतम पड़ोसी एल्गोरिथम की व्याख्या करें?

K-निकटतम पड़ोसी सबसे सरल मशीन लर्निंग एल्गोरिदम है जो पर्यवेक्षित शिक्षण तकनीक पर आधारित है। यह नए मामले या डेटा और उपलब्ध मामलों के बीच समानता मानता है, और यह नए मामले को एक ऐसी श्रेणी में रखता है जो उपलब्ध श्रेणियों के समान है।

उदाहरण के लिए, हमारे पास एक प्राणी की एक छवि है जो एक बिल्ली और एक कुत्ते के समान दिखती है, लेकिन हम यह जानना चाहते हैं कि यह बिल्ली है या कुत्ता। इस पहचान के लिए, हम KNN एल्गोरिथम का उपयोग कर सकते हैं, क्योंकि यह समानता के आधार पर काम करता है। KNN मॉडल नए डेटा सेट की बिल्लियों और कुत्तों की छवियों की समानता को खोजेगा, और यह समान विशेषताओं पर आधारित है; यह इसे बिल्ली या कुत्ते की श्रेणी में रखेगा।

71. मशीन लर्निंग एल्गोरिदम की दी गई लंबी सूची को ध्यान में रखते हुए, एक डेटा सेट दिया गया है, कैसे करें ईमेल के स्पैम फ़िल्टर को सैकड़ों ईमेल के साथ फीड किया जाएगा आप तय करें कि किसका उपयोग करना है?

एल्गोरिथम चुनना नीचे दिए गए प्रश्नों पर निर्भर करता है:

  1. आपके पास कितना डेटा है, और क्या वह निरंतर या श्रेणीबद्ध है?
  2. क्या समस्या वर्गीकरण, क्लस्टरिंग, संघ या प्रतिगमन से संबंधित है?
  3. क्या यह एक पूर्वनिर्धारित चर (लेबल), लेबल रहित, या दोनों का मिश्रण है?
  4. प्राथमिक उद्देश्य क्या है?

उपरोक्त प्रश्नों के आधार पर, किसी को सही एल्गोरिथम चुनना होगा जो उनकी आवश्यकता के अनुरूप हो।

72. क्या आप हमें बता सकते हैं कि ईमेल स्पैम फ़िल्टर कैसे डिज़ाइन करें?

  1. ईमेल के स्पैम फ़िल्टर को सैकड़ों ईमेल के साथ फीड किया जाएगा।
  2. इनमें से प्रत्येक ईमेल का एक लेबल होता है: 'स्पैम' या 'स्पैम नहीं'।
  3. पर्यवेक्षित मशीन लर्निंग एल्गोरिदम तब पहचान करेगा कि लॉटरी, नो मनी, फुल रिफंड आदि जैसे स्पैम कीवर्ड के आधार पर किस प्रकार के ईमेल को स्पैम के रूप में चिह्नित किया जा रहा है।
  4. अगली बार जब कोई ईमेल इनबॉक्स में आता है, तो स्पैम फ़िल्टर सांख्यिकीय विश्लेषण और डिसीजन ट्री और एसवीएम जैसे एल्गोरिदम का उपयोग करेगा ताकि यह पता लगाया जा सके कि ईमेल के स्पैम होने की कितनी संभावना है।
  5. यदि संभावना अधिक है, तो इसे स्पैम के रूप में लेबल किया जाएगा, और ईमेल आपके इनबॉक्स में नहीं आएगा।
  6. प्रत्येक मॉडल की सटीकता के आधार पर, हम दिए गए सभी मॉडलों का परीक्षण करने के बाद उच्चतम विश्वसनीयता के साथ एल्गोरिदम का उपयोग करते हैं।

73. आप ओवरफिटिंग से कैसे बच सकते हैं?

निम्नलिखित चरणों का पालन करके ओवरफिटिंग से बचा जाता है:

    परिणाम का सत्यापन करना: यहां विचार विभिन्न छोटे ट्रेन परीक्षण स्पिल उत्पन्न करने के लिए प्रारंभिक प्रशिक्षण डेटा का उपयोग करना है। जहां इन टेस्ट स्पिल का इस्तेमाल मॉडल को ट्यून करने के लिए किया जाता है।अधिक डेटा के साथ ट्रेन: बहुत सारे डेटा के साथ प्रशिक्षण एल्गोरिदम को संकेतों का बेहतर पता लगाने में मदद कर सकता है।सुविधा हटाएं: आप कुछ सुविधाओं को मैन्युअल रूप से हटा सकते हैं।जल्दी रुकना:यह शिक्षार्थी द्वारा निर्दिष्ट बिंदु को पार करने से पहले प्रशिक्षण प्रक्रिया को रोकने के लिए संदर्भित करता है।नियमितीकरण: यह मॉडल को सरल बनाने के लिए कृत्रिम रूप से मजबूर करने के लिए तकनीकों की एक विस्तृत श्रृंखला को संदर्भित करता है।सभा: ये मशीन लर्निंग एल्गोरिदम हैं जो कई अलग-अलग मॉडलों से भविष्यवाणियों को जोड़ते हैं।

74. मशीन लर्निंग में सिलेक्शन बायस शब्द की व्याख्या करें?

चयन पूर्वाग्रह तब होता है जब डेटा सेट के उदाहरणों को इस तरह से चुना जाता है कि यह उनके वास्तविक-विश्व वितरण को प्रतिबिंबित नहीं करता है। चयन पूर्वाग्रह कई विभिन्न रूप ले सकता है।

    कवरेज पूर्वाग्रह: यहां डेटा को प्रतिनिधि तरीके से नहीं चुना गया है।

उदाहरण: एक मॉडल को उत्पाद खरीदने वाले ग्राहकों के नमूने के साथ किए गए फोन सर्वेक्षणों के आधार पर एक नए उत्पाद की भविष्य की बिक्री की भविष्यवाणी करने के लिए इस तरह से प्रशिक्षित किया जाता है। इसके बजाय प्रतिस्पर्धी उत्पाद खरीदने का विकल्प चुनने वाले उपभोक्ताओं का सर्वेक्षण नहीं किया गया, और परिणामस्वरूप, लोगों के इस समूह का प्रशिक्षण डेटा में प्रतिनिधित्व नहीं किया गया।

    गैर-प्रतिक्रिया पूर्वाग्रह: डेटा प्रक्रियाओं के संग्रह में भागीदारी अंतराल के कारण यहां डेटा गैर-प्रतिनिधित्व के रूप में समाप्त होता है।

उदाहरण: एक मॉडल को इस तरह से प्रशिक्षित किया जाता है कि वह उत्पाद खरीदने वाले ग्राहकों के नमूने और प्रतिस्पर्धी उत्पाद खरीदने वाले ग्राहकों के नमूने के साथ किए गए फोन सर्वेक्षणों के आधार पर किसी नए उत्पाद की भविष्य की बिक्री की भविष्यवाणी कर सके। जिन ग्राहकों ने प्रतिस्पर्धी उत्पाद खरीदा, उनसे सर्वेक्षण पूरा करने से इंकार करने की अपेक्षा 80% अधिक थी, और उनके डेटा को नमूने में कम प्रस्तुत किया गया था।

    आंकड़ों की अशुद्धि:यहाँ , डेटा संग्रह प्रक्रिया के दौरान उचित यादृच्छिकरण का उपयोग नहीं किया जाता है।

उदाहरण: एक मॉडल जिसे उत्पाद खरीदने वाले ग्राहकों के नमूने और प्रतिस्पर्धी उत्पाद खरीदने वाले ग्राहकों के नमूने के साथ किए गए फोन सर्वेक्षणों के आधार पर एक नए उत्पाद की भविष्य की बिक्री की भविष्यवाणी करने के लिए प्रशिक्षित किया जाता है। ग्राहकों को बेतरतीब ढंग से लक्षित करने के बजाय, सर्वेक्षक ने उन पहले 200 उपभोक्ताओं को चुना जिन्होंने उनके ईमेल का जवाब दिया, जो औसत खरीदारों की तुलना में उत्पाद के बारे में अधिक उत्सुक थे।

75. पर्यवेक्षित शिक्षण के प्रकारों की व्याख्या करें?

पर्यवेक्षित शिक्षण दो प्रकार का होता है, अर्थात्,

    प्रतिगमन:यह एक प्रकार का पर्यवेक्षित शिक्षण है जो दिए गए लेबल किए गए डेटासेट से सीखता है, और फिर यह एल्गोरिथम को दिए गए नए डेटा के लिए निरंतर-मूल्यवान आउटपुट की भविष्यवाणी करने में सक्षम है। इसका उपयोग उन मामलों में किया जाता है जहां आउटपुट की आवश्यकता धन या ऊंचाई आदि जैसी संख्या होती है। कुछ लोकप्रिय सुपरवाइज्ड लर्निंग एल्गोरिदम हैं लीनियर रिग्रेशन, लॉजिस्टिक रिग्रेशन।
    वर्गीकरण:यह एक तरह की सीख है जहां एल्गोरिदम को नए डेटा में मैप करने की आवश्यकता होती है जो हमारे पास डेटासेट में मौजूद दो वर्गों में से किसी एक से प्राप्त होता है। कक्षाओं को या तो 1 या 0 पर मैप किया जाना है, जो वास्तविक जीवन में 'हां' या 'नहीं' में अनुवाद करता है। आउटपुट को या तो कक्षाओं में से एक होना चाहिए, और यह एक संख्या नहीं होनी चाहिए जैसा कि यह था प्रतिगमन के मामले में। सबसे प्रसिद्ध एल्गोरिदम में से कुछ हैं निर्णय पेड़, Naive Bayes Classifier, Support vector Algorithms।

76. क्या लुप्त होती ढाल वंश?

मशीन लर्निंग में, हम न्यूरल नेटवर्क्स को ग्रेडिएंट-आधारित विधियों जैसे बैक प्रोपेगेशन के साथ प्रशिक्षण देते समय लुप्त हो रही ग्रेडिएंट समस्या का सामना करते हैं। यह समस्या दिए गए नेटवर्क में पिछली परतों के मापदंडों को ट्यून करना और सीखना कठिन बना देती है।

लुप्त होती ग्रेडिएंट समस्या को अस्थिर व्यवहार के एक उदाहरण के रूप में लिया जा सकता है जिसका सामना हम गहरे तंत्रिका नेटवर्क को प्रशिक्षित करते समय कर सकते हैं।

यह एक ऐसी स्थिति का वर्णन करता है जहां डीप मल्टीलेयर फीड-फॉरवर्ड नेटवर्क या आवर्तक तंत्रिका नेटवर्क मॉडल के दिए गए आउटपुट एंड से उपयोगी ग्रेडिएंट जानकारी को वापस मॉडल के इनपुट एंड के करीब की परतों तक फैलाने में सक्षम नहीं है।

77. क्या आप लुप्त हो रही ढाल की समस्या को दूर करने के लिए प्रस्तावित विधियों के नाम बता सकते हैं?

लुप्त होती प्रवणता समस्याओं को दूर करने के लिए प्रस्तावित विधियाँ हैं:

  1. बहु-स्तरीय पदानुक्रम
  2. लंबी अल्पकालिक स्मृति
  3. तेज़ हार्डवेयर
  4. अवशिष्ट तंत्रिका नेटवर्क (ResNets)
  5. फिर शुरू करना

78. के ​​बीच अंतर करें डाटा माइनिंग और मशीन लर्निंग?

डेटा माइनिंग यंत्र अधिगम
यह बड़ी मात्रा में डेटा से उपयोगी जानकारी निकालता है।यह डेटा के साथ-साथ पिछले अनुभव से एल्गोरिदम पेश करता है।
इसका उपयोग डेटा के प्रवाह को समझने के लिए किया जाता है।यह कंप्यूटर को डेटा प्रवाह से सीखना और समझना सिखाता है।
इसमें असंरचित डेटा के साथ विशाल डेटाबेस हैं।इसमें मौजूदा डेटा के साथ-साथ एल्गोरिदम भी हैं।
इसमें मानवीय हस्तक्षेप की आवश्यकता है।डिजाइन के बाद मानव प्रयास की आवश्यकता नहीं है
डेटा माइनिंग तकनीक का उपयोग करके मॉडल विकसित किए जाते हैंमशीन-लर्निंग एल्गोरिदम का उपयोग निर्णय वृक्ष, तंत्रिका नेटवर्क और कृत्रिम बुद्धि के कुछ अन्य भागों में किया जा सकता है
यह मशीन लर्निंग जैसी विधियों का उपयोग करके अधिक शोध है।यह स्व-शिक्षित है और बुद्धिमान कार्यों को करने के लिए सिस्टम को प्रशिक्षित करता है।

79. मशीन लर्निंग में विभिन्न एल्गोरिथम तकनीकों के नाम बताएं?

मशीन लर्निंग में विभिन्न एल्गोरिथम तकनीकें नीचे सूचीबद्ध हैं:

  1. अनुपयोगी शिक्षा
  2. अर्ध पर्यवेक्षित शिक्षण
  3. पारगमन
  4. सुदृढीकरण सीखना
  5. सीखना सीख रहा हूं
  6. पर्यवेक्षित अध्ययन

80. 'अनपर्यवेज़्ड लर्निंग' के कार्य की व्याख्या करें?

  1. इसे डेटा के समूहों को खोजना होगा।
  2. डेटा के निम्न-आयामी प्रतिनिधित्व खोजें
  3. डेटा में दिलचस्प दिशा-निर्देश खोजने के लिए
  4. दिलचस्प निर्देशांक और सहसंबंधों की गणना करने के लिए।
  5. उपन्यास अवलोकन या डेटाबेस सफाई खोजें।

81. मशीन लर्निंग में क्लासिफायरियर शब्द की व्याख्या करें?

मशीन लर्निंग में एक क्लासिफायरियर को एक एल्गोरिथ्म के रूप में परिभाषित किया जाता है जो डेटा को स्वचालित रूप से एक या अधिक वर्गों के समूह में वर्गीकृत करता है। सामान्य उदाहरणों में से एक ईमेल क्लासिफायरियर है जो दिए गए क्लास लेबल द्वारा ईमेल को फ़िल्टर करने के लिए स्कैन कर सकता है: स्पैम या स्पैम नहीं।

हमारे पास पांच प्रकार के वर्गीकरण एल्गोरिदम हैं, अर्थात्,

  1. निर्णय वृक्ष
  2. Naive Bayes Classifier
  3. K-निकटतम पड़ोसी
  4. समर्थन वेक्टर मशीन
  5. कृत्रिम तंत्रिका प्रसार

82. आनुवंशिक क्या हैं? एल्गोरिदम ?

जेनेटिक एल्गोरिदम को स्टोकेस्टिक सर्च एल्गोरिदम के रूप में परिभाषित किया जाता है जो संभावित समाधानों की आबादी पर कार्य कर सकता है। आनुवंशिक एल्गोरिदम का उपयोग मुख्य रूप से कृत्रिम बुद्धिमत्ता में संभावित समाधानों के स्थान की खोज करने के लिए किया जाता है ताकि समस्या का समाधान किया जा सके।

83. क्या आप उस क्षेत्र का नाम बता सकते हैं जहां पैटर्न पहचान का उपयोग किया जा सकता है?

  1. वाक् पहचान
  2. आंकड़े
  3. अनौपचारिक पुनर्प्राप्ति
  4. बायोइनफॉरमैटिक्स
  5. डेटा माइनिंग
  6. कंप्यूटर दृष्टी

84. मशीन लर्निंग में परसेप्ट्रॉन शब्द की व्याख्या करें?

एक परसेप्ट्रॉन को बाइनरी क्लासिफायर के पर्यवेक्षित सीखने के लिए एक एल्गोरिथ्म के रूप में परिभाषित किया गया है। यह एल्गोरिथम न्यूरॉन्स को एक समय में दिए गए प्रशिक्षण सेट में तत्वों को सीखने और संसाधित करने में सक्षम बनाता है। परसेप्ट्रोन दो प्रकार के होते हैं, अर्थात्।

  1. एकल परत
  2. बहुपरत।

85. क्या है आइसोटोनिक रिग्रेशन?

आइसोटोनिक प्रतिगमन सापेक्ष असमानता क्रम की रक्षा के लिए आदर्श दूरी को फिट करने के लिए पुनरावृत्त रूप से उपयोग किया जाता है। पर्यवेक्षित मशीन लर्निंग मॉडल की अनुमानित संभावनाओं को संतुलित करने के लिए संभाव्य वर्गीकरण में आइसोटोनिक प्रतिगमन का भी उपयोग किया जाता है।

86. बायेसियन नेटवर्क क्या हैं?

एक बायेसियन नेटवर्क को एक संभाव्य ग्राफिकल मॉडल के रूप में परिभाषित किया जा सकता है जो एक डीएजी (निर्देशित एसाइक्लिक ग्राफ) के माध्यम से चर और उनकी सशर्त निर्भरता का एक सेट प्रस्तुत करता है।

उदाहरण के लिए, एक बायेसियन नेटवर्क बीमारियों और उनके लक्षणों के बीच संभाव्य संबंधों का प्रतिनिधित्व करेगा। विशिष्ट लक्षणों को देखते हुए, विभिन्न रोगों की उपस्थिति की संभावनाओं की गणना के लिए नेटवर्क का उपयोग किया जा सकता है।

87. क्या आप बायेसियन लॉजिक प्रोग्राम के दो घटकों की व्याख्या कर सकते हैं?

बायेसियन लॉजिक प्रोग्राम में मुख्य रूप से दो घटक होते हैं।

  1. पहला घटक तार्किक है: इसमें बायेसियन क्लॉज का एक सेट शामिल है जो डोमेन की गुणात्मक संरचना को कैप्चर करता है।
  2. दूसरा घटक मात्रात्मक है: यह डोमेन के बारे में मात्रात्मक जानकारी को एन्कोड करता है।

88. एक पहनावा में एक वृद्धिशील शिक्षण एल्गोरिथ्म क्या है?

इंक्रीमेंटल लर्निंग मेथड को नए डेटा से सीखने के लिए एल्गोरिदम की क्षमता के रूप में परिभाषित किया गया है जो कि क्लासिफायर के बाद पहले से उपलब्ध डेटासेट से उत्पन्न हो चुका है।

89. संबंधपरक मूल्यांकन तकनीकों के घटकों के नाम बताइए?

संबंधपरक मूल्यांकन तकनीक के घटक नीचे सूचीबद्ध हैं:

  1. आंकड़ा अधिग्रहण
  2. जमीनी सच्चाई का अधिग्रहण
  3. क्रॉस-सत्यापन तकनीक
  4. प्रश्न प्रकार
  5. स्कोरिंग मीट्रिक
  6. महत्व परीक्षण

90. क्या आप इसकी व्याख्या कर सकते हैं? पहनावा विधि में वर्गीकरण त्रुटि का पूर्वाग्रह-विचरण अपघटन?

लर्निंग एल्गोरिदम की अपेक्षित त्रुटि को पूर्वाग्रह और विचरण में विभाजित किया जा सकता है। पूर्वाग्रह शब्द इस बात का माप है कि लर्निंग एल्गोरिदम द्वारा उत्पादित औसत क्लासिफायरियर लक्ष्य फ़ंक्शन के साथ कितनी निकटता से मेल खाता है। विचरण शब्द इस बात का माप है कि विभिन्न प्रशिक्षण सेटों के लिए लर्निंग एल्गोरिदम की भविष्यवाणी में कितना उतार-चढ़ाव होता है।

91. अनुक्रमिक पर्यवेक्षित शिक्षण के लिए विभिन्न विधियों के नाम बताइए?

अनुक्रमिक पर्यवेक्षित शिक्षण की विभिन्न विधियाँ नीचे दी गई हैं:

  1. आवर्तक स्लाइडिंग खिड़कियां
  2. छिपे हुए मार्को मॉडल
  3. अधिकतम एन्ट्रापी मार्को मॉडल
  4. सशर्त यादृच्छिक क्षेत्र
  5. ग्राफ ट्रांसफार्मर नेटवर्क
  6. स्लाइडिंग-विंडो तरीके

92. बैच सांख्यिकीय शिक्षा क्या है?

एक प्रशिक्षण डेटासेट को एक या अधिक बैचों में विभाजित किया जाता है। जब एक बैच के निर्माण में सभी प्रशिक्षण नमूनों का उपयोग किया जाता है, तो उस लर्निंग एल्गोरिदम को बैच ग्रेडिएंट डिसेंट के रूप में जाना जाता है। जब दिया गया बैच एक नमूने के आकार का होता है, तो लर्निंग एल्गोरिदम को स्टोकेस्टिक ग्रेडिएंट डिसेंट कहा जाता है।

93. क्या आप रोबोटिक्स और सूचना प्रसंस्करण के उन क्षेत्रों के नाम बता सकते हैं जहां क्रमिक भविष्यवाणी की समस्या उत्पन्न होती है?

रोबोटिक्स और सूचना प्रसंस्करण के क्षेत्र जहां अनुक्रमिक भविष्यवाणी की समस्या उत्पन्न होती है, नीचे दिए गए हैं:

  1. संरचित भविष्यवाणी
  2. मॉडल-आधारित सुदृढीकरण सीखना
  3. नकली सीखना

94. उन विभिन्न श्रेणियों के नाम बताइए जिन्हें आप अनुक्रम सीखने की प्रक्रिया को वर्गीकृत कर सकते हैं?

विभिन्न श्रेणियां जहां आप अनुक्रम सीखने की प्रक्रिया को वर्गीकृत कर सकते हैं, नीचे सूचीबद्ध हैं:

  1. अनुक्रम पीढ़ी
  2. अनुक्रम पहचान
  3. अनुक्रमिक निर्णय
  4. अनुक्रम भविष्यवाणी

95. अनुक्रम भविष्यवाणी क्या है?

अनुक्रम भविष्यवाणी का उद्देश्य पूर्ववर्ती तत्वों के आधार पर अनुक्रम के तत्वों की भविष्यवाणी करना है।

एक भविष्यवाणी मॉडल को प्रशिक्षण अनुक्रमों के सेट के साथ प्रशिक्षित किया जाता है। प्रशिक्षण पर, मॉडल का उपयोग अनुक्रम की भविष्यवाणी करने के लिए किया जाता है। एक भविष्यवाणी में अनुक्रम के अगले आइटम की भविष्यवाणी करना शामिल है। इस कार्य में वेब पेज प्रीफेचिंग, मौसम पूर्वानुमान, उपभोक्ता उत्पाद अनुशंसा, और शेयर बाजार भविष्यवाणी जैसे कई अनुप्रयोग हैं।

अनुक्रम भविष्यवाणी समस्याओं के उदाहरणों में शामिल हैं:

    मौसम की भविष्यवाणी. समय की अवधि में विशेष मौसम के बारे में टिप्पणियों के एक क्रम को देखते हुए, यह कल के अपेक्षित मौसम की भविष्यवाणी करता है।शेयर बाजार भविष्यवाणी. समय की अवधि में सुरक्षा के आंदोलनों के अनुक्रम को देखते हुए, यह सुरक्षा के अगले आंदोलन की भविष्यवाणी करता है।उत्पाद अनुशंसा. किसी ग्राहक की अंतिम खरीदारी के क्रम को देखते हुए, यह ग्राहक की अगली खरीदारी की भविष्यवाणी करता है।

96. पीएसी लर्निंग की व्याख्या करें?

संभवत: लगभग सही, यानी, पीएसी लर्निंग को एक सैद्धांतिक ढांचे के रूप में परिभाषित किया गया है जिसका उपयोग किसी दिए गए प्रशिक्षण सेट पर इसकी त्रुटि और जटिलता के कुछ उपायों के संदर्भ में सीखने के एल्गोरिदम की सामान्यीकरण त्रुटि का विश्लेषण करने के लिए किया जाता है। यहां मुख्य लक्ष्य आम तौर पर यह दिखाना है कि एक एल्गोरिदम उच्च संभावना के साथ कम सामान्यीकरण त्रुटि प्राप्त कर सकता है।

97. पीसीए, केपीसीए और आईसीए क्या हैं और इनका उपयोग किस लिए किया जाता है?

प्रिंसिपल कंपोनेंट्स एनालिसिस (पीसीए): यह मूल इनपुट को रैखिक रूप से नई असंबद्ध सुविधाओं में बदल देता है।

कर्नेल-आधारित प्रिंसिपल कंपोनेंट एनालिसिस (KCPA) : यह कर्नेल विधि का उपयोग करके विकसित एक गैर-रेखीय पीसीए है।

स्वतंत्र घटक विश्लेषण (आईसीए): आईसीए में, मूल इनपुट रैखिक रूप से कुछ विशेषताओं में परिवर्तित हो जाते हैं जो पारस्परिक रूप से सांख्यिकीय रूप से स्वतंत्र होते हैं।

98. मशीन लर्निंग में एक मॉडल के निर्माण के तीन चरणों की व्याख्या करें?

तीन चरण हैं:

  1. प्रतिरूप निर्माण
  2. मॉडल परीक्षण
  3. मॉडल लागू करना

99. एमएल में परिकल्पना शब्द की व्याख्या करें?

मशीन लर्निंग, विशेष रूप से पर्यवेक्षित शिक्षण, को एक फ़ंक्शन सीखने के लिए उपलब्ध डेटा का उपयोग करने की इच्छा के रूप में निर्दिष्ट किया जा सकता है जो आउटपुट के लिए इनपुट को सर्वोत्तम रूप से मैप करता है।

तकनीकी रूप से, इस समस्या को फ़ंक्शन सन्निकटन कहा जाता है, जहां हम एक अज्ञात लक्ष्य फ़ंक्शन का अनुमान लगा रहे हैं जिसे हम मानते हैं कि यह मौजूद है जो समस्या डोमेन से सभी संभावित विचारों पर आउटपुट के लिए दिए गए इनपुट को सर्वोत्तम रूप से मैप कर सकता है।

मॉडल का एक उदाहरण जो लक्ष्य फ़ंक्शन का अनुमान लगाता है और आउटपुट में इनपुट की मैपिंग करता है उसे मशीन लर्निंग में परिकल्पना के रूप में जाना जाता है।

एल्गोरिथम की पसंद और एल्गोरिथम का विन्यास संभावित परिकल्पनाओं के स्थान को परिभाषित करता है जो मॉडल का गठन कर सकता है।

100. मशीन लर्निंग में एपोच, एन्ट्रॉपी, बीबियास और वेरिएंस शब्दों की व्याख्या करें?

युग मशीन लर्निंग में व्यापक रूप से इस्तेमाल किया जाने वाला शब्द है जो पूरे प्रशिक्षण डेटासेट के पास की संख्या को इंगित करता है जिसे मशीन लर्निंग एल्गोरिदम ने पूरा किया है। यदि बैच का आकार संपूर्ण प्रशिक्षण डेटासेट है, तो युगों की संख्या को पुनरावृत्तियों की संख्या के रूप में परिभाषित किया जाता है।

एन्ट्रापी मशीन लर्निंग में विकार या अनिश्चितता के माप के रूप में परिभाषित किया जा सकता है। मशीन लर्निंग मॉडल और डेटा वैज्ञानिकों का मुख्य लक्ष्य, सामान्य रूप से अनिश्चितता को कम करना है।

आंकड़े पक्षपात एक प्रकार की त्रुटि है जिसमें डेटासेट के कुछ तत्व दूसरों की तुलना में अधिक भारित होते हैं।

झगड़ा को उस राशि के रूप में परिभाषित किया जाता है जो लक्ष्य फ़ंक्शन का अनुमान बदल जाएगा यदि एक अलग प्रशिक्षण डेटा सेट का उपयोग किया गया था। लक्ष्य फ़ंक्शन का अनुमान आमतौर पर मशीन लर्निंग एल्गोरिथम द्वारा प्रशिक्षण डेटा से लगाया जाता है।

आपके मशीन लर्निंग इंटरव्यू के लिए शुभकामनाएँ। हम आशा करते हैं कि हमारे मशीन लर्निंग इंटरव्यू प्रश्न और उत्तर आपकी कुछ मदद करेंगे। आप हमारी जांच भी कर सकते हैं साइबर सुरक्षा साक्षात्कार प्रश्न और उत्तर जो आपके कुछ काम आ सकता है।