सामान्यता कैलकुलेटर
यदि आपका डेटा विभिन्न सांख्यिकी परीक्षणों का उपयोग करके सामान्य वितरण का अनुसरण करता है तो परीक्षण करें।
सामान्यता के लिए टेस्ट
सामग्री तालिका
सामान्यता परीक्षण के लिए व्यापक गाइड
सामान्यता के लिए टेस्ट क्यों?
सामान्यता परीक्षण सांख्यिकीय विश्लेषण में एक मूलभूत कदम है। कई सांख्यिकीय परीक्षण और प्रक्रियाएं (जैसे टी-परीक्षण, ANOVA, और प्रतिगमन विश्लेषण) इस धारणा पर बनाई गई हैं कि डेटा सामान्य वितरण का अनुसरण करता है। गैर-सामान्य डेटा पर इन परीक्षणों का उपयोग करने से अमान्य निष्कर्ष और त्रुटिपूर्ण निर्णय हो सकते हैं।
सामान्यता परीक्षण के लिए मुख्य कारण:
- पैरामीट्रिक सांख्यिकीय परीक्षणों के लिए मान्यताओं को मान्य करें
- अपने डेटा के लिए उचित विश्लेषणात्मक तरीकों को निर्धारित करना
- संभावित डेटा संग्रह मुद्दों या outliers की पहचान करें
- गाइड डेटा परिवर्तन निर्णय
- विनिर्माण और अनुसंधान में गुणवत्ता नियंत्रण का समर्थन
सामान्यता टेस्ट समझाया
Shapiro-Wilk टेस्ट
Shapiro-Wilk परीक्षण सबसे शक्तिशाली सामान्यता परीक्षण में से एक माना जाता है, विशेष रूप से छोटे से मध्यम नमूना आकार (n) के लिए< 50).
यह कैसे काम करता है:
परीक्षण एक डब्ल्यू सांख्यिकी की गणना करता है जो परीक्षण करता है कि क्या एक यादृच्छिक नमूना सामान्य वितरण से आता है। W statistic वैरिएशन का सबसे अच्छा आकलनकर्ता का अनुपात है जो वैरिएशन के वर्ग estimator के सामान्य सही योग के लिए है।
सूत्र:
W = (Σaix(i))2 / Σ(xi - x̄)2
व्याख्या:
यदि p-value अल्फा (आम तौर पर 0.05) से अधिक है, तो हम शून्य परिकल्पना को अस्वीकार करने में विफल रहते हैं कि डेटा सामान्य रूप से वितरित किया जाता है।
एंडरसन-डार्लिंग टेस्ट
एंडरसन-डार्लिंग परीक्षण वितरण की पूंछ में विचलन के लिए विशेष रूप से संवेदनशील है, जिससे यह बाहरी और संदेह का पता लगाने में उत्कृष्ट हो जाता है।
यह कैसे काम करता है:
परीक्षण सामान्य वितरण के CDF के साथ अपने नमूना डेटा के अनुभवजन्य संचयी वितरण समारोह (CDF) की तुलना करता है, जो अन्य परीक्षणों की तुलना में पूंछ को अधिक वजन देता है।
लाभ:
- बड़े नमूनों के साथ अच्छा प्रदर्शन (n > 50)
- वितरण पूंछ में विचलन के प्रति अधिक संवेदनशील
- दोनों कंकाल और कुर्टोसिस मुद्दों का पता लगा सकता है
व्याख्या:
कम A2 मान डेटा को इंगित करते हैं कि अधिक बारीकी से सामान्य वितरण का अनुसरण करते हैं। यदि p-value आपके महत्व स्तर से अधिक है, तो डेटा को सामान्य माना जा सकता है।
Kolmogorov-Smirnov टेस्ट
Kolmogorov-Smirnov (K-S) परीक्षण आपके नमूने के अनुभवजन्य वितरण समारोह और संदर्भ वितरण (सामान्य) के संचयी वितरण समारोह के बीच अधिकतम दूरी को मापता है।
यह कैसे काम करता है:
K-S परीक्षण सांख्यिकी (D) अनुभवजन्य और सैद्धांतिक संचयी वितरण कार्यों के बीच अधिकतम ऊर्ध्वाधर दूरी पर आधारित है।
मुख्य विशेषताएं:
- किसी भी नमूने के आकार के लिए काम करता है, लेकिन बड़े नमूनों के साथ सबसे शक्तिशाली
- वितरण पूंछ में विचलन के लिए कम संवेदनशील
- किसी भी निरंतर वितरण के खिलाफ परीक्षण के लिए बहुमुखी
कब उपयोग करें:
जब आपको बड़ी डेटासेट के साथ सामान्यता के लिए परीक्षण करने की आवश्यकता होती है और पूंछ व्यवहार के बारे में कम चिंतित होते हैं।
टेस्ट प्रदर्शन की तुलना
| टेस्ट | सर्वश्रेष्ठ नमूना आकार | संवेदनशीलता | शक्ति | सीमा |
|---|---|---|---|---|
| Shapiro-Wilk | 3-50 | उच्च | छोटे नमूनों के लिए शक्तिशाली | मूल रूप में छोटे नमूनों तक सीमित |
| एंडरसन-Darling | सबसे अच्छा>50 | (sp. in पूंछ) | पूंछ विचलन का पता लगाने के लिए उत्कृष्ट | अधिक जटिल गणना |
| Kolmogorov-Smirnov | कोई | मध्यम | बहुमुखी, किसी भी निरंतर वितरण के साथ काम करता है | दूसरों की तुलना में कम संवेदनशील, विशेष रूप से पूंछ के लिए |
टेस्ट परिणामों की व्याख्या कैसे करें
सामान्यता परीक्षण के परिणामों का विश्लेषण करते समय, इन दिशानिर्देशों का पालन करें:
जब डेटा दिखाई देता है सामान्य
यदि p-value > α (significance स्तर):
- असफलता को अस्वीकार करने के लिए
- डेटा सामान्य वितरण के अनुरूप है
- पैरामीट्रिक परीक्षणों का उपयोग करने के लिए उपयुक्त
- टी-परीक्षण, ANOVA, रैखिक प्रतिगमन, आदि के साथ आगे बढ़ें।
जब डेटा गैर-सामान्य प्रकट होता है
यदि p-value ≤ α (significance स्तर):
- null hypothesis अस्वीकार
- डेटा की संभावना सामान्य वितरण से अलग हो जाती है
- गैर पैरामीट्रिक विकल्प पर विचार करें
- डेटा परिवर्तन उपयुक्त हो सकता है (लॉग, स्क्वायर रूट, आदि)
महत्वपूर्ण विचार
- नमूना आकार के मामले:टेस्ट बड़े नमूनों के साथ तेजी से संवेदनशील हो जाते हैं, संभावित रूप से नाबालिग का पता लगाने, व्यावहारिक रूप से महत्वहीन विचलन
- दृश्य निरीक्षण मूल्यवान है:हमेशा Q-Q भूखंडों और हिस्टोग्रामों के साथ सांख्यिकीय परीक्षणों का पूरक है
- केंद्रीय सीमा Theorem:बड़े नमूनों (n > 30) के साथ, कई सांख्यिकीय प्रक्रियाएं सामान्यता से मध्यम प्रस्थान के लिए मजबूत हैं
- संदर्भ कुंजी है:अपने विशिष्ट विश्लेषण और अनुसंधान प्रश्नों पर गैर-सामान्यता के प्रभाव पर विचार करें
गैर-सामान्य डेटा से निपटने
यदि आपका डेटा सामान्यता परीक्षण में विफल रहता है, तो आपके पास कई विकल्प हैं:
-
अपने डेटा को परिवर्तित करें:डेटा को सामान्य बनाने के लिए गणितीय परिवर्तन लागू करें:
- लॉग परिवर्तन: सही-स्कewed डेटा के लिए
- स्क्वायर रूट रूपांतरण: गिनती डेटा के लिए या मध्यम सही skew
- बॉक्स-Cox परिवर्तन: विभिन्न गैर-सामान्य पैटर्न के लिए लचीला दृष्टिकोण
-
गैर पैरामीट्रिक परीक्षण का प्रयोग करें:ये परीक्षण सामान्यता नहीं मानते हैं:
- Mann-Whitney U test ( स्वतंत्र टी टेस्ट के बजाय)
- विल्कोक्सन हस्ताक्षरित रैंक परीक्षण (जोड़ा टी टेस्ट के बजाय)
- Kruskal-Wallis परीक्षण (एक तरफ ANOVA के बजाय)
- बूटस्ट्रैप विधि:Resampling तकनीकों कि वितरणात्मक धारणाओं की आवश्यकता नहीं है
- मजबूत सांख्यिकीय विधि:सामान्यता से बाहरी और प्रस्थान से कम प्रभावित होने वाली तकनीकें
सामान्यता परीक्षण के व्यावहारिक अनुप्रयोग
गुणवत्ता नियंत्रण
विनिर्माण में, सामान्यता परीक्षण यह सत्यापित करने में मदद करता है कि उत्पादन प्रक्रियाएं स्थिर और पूर्वानुमान योग्य हैं। गैर-सामान्य परिणाम जांच की आवश्यकता प्रक्रिया समस्याओं को इंगित कर सकते हैं।
वैज्ञानिक अनुसंधान
शोधकर्ता सांख्यिकीय विश्लेषण की वैधता सुनिश्चित करने के लिए सामान्यता परीक्षण का उपयोग करते हैं, विशेष रूप से दवा, मनोविज्ञान और सामाजिक विज्ञान जैसे क्षेत्रों में।
वित्तीय विश्लेषण
रिटर्न की सामान्यता का परीक्षण जोखिम मूल्यांकन, पोर्टफोलियो अनुकूलन और वित्त में विकल्प मूल्य निर्धारण मॉडल के लिए महत्वपूर्ण है।
पर्यावरण निगरानी
पर्यावरणीय डेटा को अक्सर प्रवृत्तियों या सीमा पारगमन का पता लगाने के लिए उपयुक्त सांख्यिकीय दृष्टिकोण निर्धारित करने के लिए सामान्यता परीक्षण की आवश्यकता होती है।
सर्वश्रेष्ठ अभ्यास सारांश
- हमेशा दृश्य विधियों (हिस्टोग्राम, क्यू-क्यू प्लॉट) के साथ सांख्यिकीय परीक्षणों को जोड़ती है।
- अपने नमूना आकार और विश्लेषण आवश्यकताओं के आधार पर उचित परीक्षण चुनें
- गैर-सामान्यता के व्यावहारिक महत्व पर विचार करें, न केवल सांख्यिकीय महत्व
- अनुसंधान और रिपोर्ट में अपनी सामान्यता मूल्यांकन प्रक्रिया का दस्तावेज
- जब संदेह में, जटिल विश्लेषण के लिए एक सांख्यिकीय के साथ परामर्श पर विचार करें
सामान्यता क्या है?
सामान्य वितरण (जिसे गौसियन वितरण भी कहा जाता है) एक सतत संभावना वितरण है जो एक सममित घंटी के आकार का वक्र की विशेषता है। यह अपने अर्थ और मानक विचलन द्वारा परिभाषित किया गया है।
- बेल के आकार का वक्र
- बीच में सममित
- 68% 1 मानक विचलन के भीतर डेटा
- 95% 2 मानक विचलन के भीतर डेटा
- 99.7% 3 मानक विचलन के भीतर डेटा
सामान्यता परीक्षण
Shapiro-Wilk टेस्ट
छोटे नमूनों के लिए सर्वश्रेष्ठ (n)< 50)
एंडरसन-डार्लिंग टेस्ट
बड़े नमूनों के लिए अच्छा
Kolmogorov-Smirnov टेस्ट
किसी भी नमूना आकार के लिए काम करता है
व्याख्या परिणाम
P-Value व्याख्या
- P-value > α: सामान्यता को अस्वीकार करने में विफल
- P-value ≤ α: सामान्यता
- सामान्य α मान: 0.01, 0.05, 0.1
सामान्य उदाहरण
उदाहरण 1आम तौर पर वितरित डेटा
[1, 2, 2, 3, 3, 3, 4, 4, 5]
परिणाम: समान रूप से सामान्य (p-value > 0.05)
उदाहरण 2Skewed डेटा
[1, 1, 1, 2, 3, 4, 5, 10]
परिणाम: सामान्य नहीं (p-value)< 0.05)
उदाहरण 3बिमोडल डेटा
[1, 1, 2, 2, 8, 9, 9, 10]
परिणाम: सामान्य नहीं (p-value)< 0.05)