Normallik Hesaplayıcı
Verileriniz çeşitli istatistiksel testleri kullanarak normal bir dağıtım izlerse test edin.
Normallik için Test
İçerik tablosu
Normallik Testine Kapsamlı Kılavuz
Normallik için neden Test?
Normallik testleri istatistiksel analizde temel bir adımdır. Birçok istatistiksel test ve prosedür (örneğin, ANOVA ve regresyon analizi) verilerin normal bir dağıtım takip ettiği varsayım üzerine inşa edilmiştir. Bu testleri normal olmayan veriler üzerinde kullanmak, geçersiz sonuçlara ve hatalı kararlara yol açabilir.
Normallik testi için temel nedenler:
- Parametrik istatistik testleri için geçerli varsayımlar
- Verileriniz için uygun analitik yöntemleri belirleyin
- Potansiyel veri toplama sorunları veya outliers
- Rehber veri dönüşümü kararları
- Üretim ve araştırmada kaliteli kontrol
Normallik Testler Açıklandı
Shapiro-Wilk Test
Shapiro-Wilk testi, özellikle küçük ila orta örnek boyutlarda (n) en güçlü normallik testlerinden biri olarak kabul edilir< 50).
Nasıl çalışır:
Test, rastgele bir örnek normal bir dağıtımdan olup olmadığını test eden bir W statistic hesaplar. W statistic, variance'ın normal düzeltilmiş toplam meydans estimatorunun oranıdır.
Formula:
W = (Σaix(i))2 / Σ(xi - x̄)2
Yorum:
P-değer alfatan daha büyükse (yaklaşık 0.05), verilerin normalde dağıtıldığı null hipotezini reddetmeyiz.
Anderson-Darling Test
Anderson-Darling testi, dağıtım kuyruklarında sapmalara özellikle duyarlıdır, bunu taklit edenlere ve skewness'e mükemmel hale getirir.
Nasıl çalışır:
Test, normal dağıtım CDF ile örnek verilerinizin ampirik dağılımını karşılaştırır, diğer testlerden daha fazla ağırlık verir.
Faydaları:
- Daha büyük örneklerle iyi performanslar (n > 50)
- Dağıtım kuyruklarında sapmalara daha hassas
- Hem skewness hem de loosis sorunlarını tespit edebilir
Yorum:
Aşağı Aşağı A2 değerleri, normal bir dağıtım takip eden verileri gösterir. P-değer sizin öneminiz seviyesini aşıyorsa, veriler normal olarak kabul edilebilir.
Kolmogorov-Smirnov Test Testi
Kolmogorov-Smirnov (K-S), örneklerinizin ampirik dağılımı ve referans dağılımının (normal) genel dağılımı arasındaki maksimum mesafeyi ölçer.
Nasıl çalışır:
K-S testi istatistiki (D) ampirik ve teorik olarak dağıtım işlevleri arasındaki maksimum dikey mesafeye dayanmaktadır.
Anahtar özellikleri:
- Herhangi bir örnek boyutu için çalışır, ancak daha büyük örneklerle en güçlü
- Dağıtım kuyruklarında sapmalara daha az hassas
- Sürekli dağıtıma karşı test için uygun
Ne zaman kullanılır:
Daha büyük veri setleriyle normalliği test etmeniz gerektiğinde en iyi kullanılan ve kuyruk davranışı hakkında daha az endişe duyuyor.
Test Performansı
| Test Testi | En İyi Örnek Boyut | Hassasiyet | Güçlüler | Sınırlamalar |
|---|---|---|---|---|
| Shapiro-Wilk | 3-50 | Yüksek Yüksek Yüksek Yüksek Yüksek | Küçük örnekler için çoğu güçlü | Orijinal formda daha küçük örneklere Sınırlı |
| Anderson-Darling | Herhangi bir, en iyi >50 | Yüksek (esp. in tails) | kuyruk sapmalarını tespit etmek için mükemmel | Daha karmaşık hesaplama |
| Kolmogorov-Smirnov | Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any Any | Moderate | Versatile, herhangi bir sürekli dağıtım ile çalışır | Diğerlerinden daha az hassas, özellikle kuyruklar için |
Test Sonuçları Nasıl Yorum Yapılır
Normallik testleri sonuçlarını analiz ettiğinizde, bu yönergeleri izleyin:
Data Normal Göründüğü zaman
Eğer p-değer > α (mihtiyacı seviye):
- null hipotezini reddetme
- Veriler normal bir dağıtım ile tutarlıdır
- Parametrik testleri kullanmak için uygun
- Proceed with t-tests, ANOVA, lineer regresyon, vs.
Data Non-Normal Göründüğü zaman
Eğer p-değer ≤ α (dikkat seviyesi):
- Reject the null hipotezi
- Veri muhtemelen normal bir dağıtımdan uzaklaşır
- Parametrik olmayan alternatifler göz önünde bulundurun
- Veri dönüşümü uygun olabilir (log, kare kökü vs.)
Önemli düşünceler
- Örnek boyut önemlidir:Testler daha büyük örneklerle daha hassas hale gelir, potansiyel olarak küçük, pratik olarak önemsiz sapmaları tespit eder
- Görsel denetim değerlidir:Her zaman Q-Q arsaları ve histogramları ile istatistiksel testleri tamamlayın
- Central Limit Theorem:Büyük örneklerle (n > 30), birçok istatistik prosedürü normallikten orta kalkışlara sağlamdır
- Context önemlidir:Belirli analiz ve araştırma sorularındaki normalliğin etkisini düşünün
Non-Normal Data ile anlaşma
Verileriniz normallik testleri yapmazsa, birkaç seçeneğiniz vardır:
-
Verilerinizi Dönüştürmek:Veriler daha normal hale getirmek için matematiksel dönüşümler uygulayın:
- Log dönüşümü: doğru adresli veriler için
- Square kök dönüşümü: veri veya orta doğru skew say için
- Box-Cox dönüşümü: çeşitli normal olmayan desenler için esnek yaklaşım
-
Parametrik olmayan testleri kullanın:Bu testler normalliği varsaymıyor:
- Mann-Whitney U testi ( bağımsız t testi yerine)
- Wilcoxon imzaladı-rank testi (tekli t testi yerine)
- Kruskal-Wallis testi (bir yönlü ANOVA yerine)
- Bottrap yöntemleri:Dağıtım varsayımlarını gerektirmeyen teknikler
- Robust istatistiksel yöntemler:Teknikler, outliers ve normalliğinden daha az etkilenmek için tasarlanmıştır
Normallik Testlerinin Pratik Uygulamaları
Kalite Kontrolü
Üretimde, normallik testleri, üretim süreçlerinin istikrarlı ve öngörülebilir olduğunu doğrulamaya yardımcı olur. Normal olmayan sonuçlar, soruşturma gerektiren süreç sorunlarını gösterebilir.
Bilimsel Araştırmalar
Araştırmacılar, istatistiksel analizlerin geçerliliğini sağlamak için normal testleri kullanırlar, özellikle tıp, psikoloji ve sosyal bilimler gibi alanlarda.
Finansal Analiz
Geri dönüşlerin normalliğini test etmek risk değerlendirme, portföy optimizasyonu ve finanstaki seçenek fiyatlandırma modelleri için önemlidir.
Çevresel İzleme
Çevresel veriler genellikle trendleri veya eş geçişleri tespit etmek için uygun istatistiksel yaklaşımlar belirlemek için normallik testleri gerektirir.
En İyi Uygulamaları Özet
- Her zaman görsel yöntemlerle istatistiksel testleri birleştirir (histogramlar, Q-Q arsalar)
- Örnek boyut ve analiz ihtiyaçlarınıza dayanan uygun testi seçin
- Normalliğin pratik önemini düşünün, sadece istatistiksel önemi değil
- Araştırmada normallik değerlendirme sürecinizi belgelemek ve raporlar
- Şüphelendiği zaman, karmaşık analizler için bir istatistikçi ile danışmanlık yapmayı düşünün
Normallik nedir?
Normal bir dağıtım (ayrıca Gaussian dağıtım olarak da bilinir) bir symmetric çan şeklinde eğri ile karakterize edilen sürekli bir olasılık dağılımıdır. Onun anlamı ve standart sapması ile tanımlanır.
- Bell- şekilli eğri
- Simetrinin etrafında
- 68% 1 standart sapma içinde veri
- 95% 2 standart sapmalar içinde veri
- 99.7% 3 standart sapmalar içinde veri
Normallik Testleri
Shapiro-Wilk Test
Küçük örnekler için en iyisi (n)< 50)
Anderson-Darling Test
Daha büyük örnekler için iyi
Kolmogorov-Smirnov Test Testi
Herhangi bir örnek boyut için çalışır
Sonuçlar
P-Value Interpretation
- p-değer > α: Normalliği reddetmek başarısız
- ≤ α: Reject normality
- Yaygın α değerleri: 0.01, 0.05, 0.1
Yaygın örnekler
Örnek 1 ÖrnekNormalde Dağıtılmış Data
Data: [1, 2, 2, 3, 3, 3, 4, 4, 5]
Sonuç: Normal (p-değer > 0.05)
Örnek 2 ÖrnekSkewed Data
Data: [1, 1, 1, 2, 2, 3, 4, 5, 10]
Sonuç: Normal değil (p-value)< 0.05)
Örnek 3 ÖrnekBimodal Data
Data: [1, 1, 1, 2, 2, 8, 9, 9, 10]
Sonuç: Normal değil (p-value)< 0.05)