正常计算器

测试您的数据是否遵循使用各种统计测试的正常分布。

计算器

正常性测试

数据值( 已分割)

测试类型

意义级别

用于确定数据是否遵循正态分布. P-值大于这个阈值表示正常.

标准测试综合指南

为什么测试正常度?

正常度测试是统计分析中的一个基本步骤. 许多统计测试和程序(如t测试、ANOVA和回归分析)建立在数据遵循正常分布的假设基础上。利用这些对非正常数据的测试会导致无效的结论和有缺陷的决定.

正常度测试的关键原因:

验证参数统计测试假设
为您的数据确定适当的分析方法
查明潜在的数据收集问题或外部因素
数据转换决定指南
支持制造业和研究的质量控制

常见测试已解释

Shapiro- Wilk 测试

夏皮罗-沃尔克测试被认为是最强大的常态测试之一,特别是对中小样本尺寸的测试(n)< 50).

如何运作:

测试计算出W统计,测试随机样本是否来自正态分布. W统计是差异的最佳估计值与通常经更正的平方估计值之和之比。

公式:

W = (Σa_ix_(i))² / Σ(x_i - x̄)²

口译:

如果p-值大于α(通常为0.05),我们就无法否定数据通常分布的无效假设.

安德森-达林测试

安德森-达林测试对分布地尾部的偏差特别敏感,使其在检测出出站和出站性方面表现优异.

如何运作:

测试将你样本数据的经验累积分布功能(CDF)与正常分布的CDF进行比较,给予尾巴比其他测试更重.

福利:

用更大的样品表现良好(n > 50)
对分布尾部偏差更为敏感
能够探测出骨折和骨质疏松问题

口译:

下调 A2值表示更接近正态分布的数据. 如果p值超过您的意义级别,则数据可以被认为是正常的.

科尔莫戈罗夫-斯米尔诺夫测试

Kolmogorov-Smirnov (K-S) 测试测量您样本的经验分布功能与参考分布(正常)的累积分布功能之间的最大距离.

如何运作:

K-S测试统计(D)是基于实证和理论累积分布函数之间的最大垂直距离.

主要特征:

用于任何样本大小,但最强的样本
对分布尾部偏差不太敏感
对任何连续分布进行测试的体温

何时使用:

当需要用更大型的数据集测试常态性,并不太关心尾端行为时,最有效使用.

比较测试性能

测试	最佳样本大小	敏感性	强度	限制
沙皮罗-沃尔克	3-50	高级	对小样本最有威力	限于原始形式的较小样品
安德森-达林	任意,最好 > 50	高 (尾部为斜)	检测尾部偏差的好办法	更复杂的计算
科尔莫戈罗夫-斯米尔诺夫	任意	温和	Versatile, 与任何连续分布一起工作	比其他人敏感,特别是尾巴

如何解释测试结果

在分析常态测试结果时,遵循本准则: 1.

当数据显示正常时

如果p-值 > α(显式级别):

未拒绝无效假设
数据符合正常分布
适合使用参数测试
进行t测试,ANOVA,线性回归等.

数据显示非正常时

如果p值为 α(显式级):

拒绝无效假设
数据可能偏离正常分布
考虑非参数替代品
数据转换可能是适当的(日志、平方根等)

重要的考虑

样本大小事项:试验随着样本增加而变得日益敏感,有可能发现微小、几乎微不足道的偏差
视觉检查很有价值:总是用Q-Q地块和直方图补充统计测试
中央限制定理:有大样本(n > 30),许多统计程序都很健全,可以适度偏离正常状态
背景是关键:考虑非正常性对您具体分析和研究问题的影响

处理非正常数据

如果您的数据不能正常度测试, 您有多个选项:

转换数据:应用数学转换使数据更加正常:
- 日志转换:用于右侧数据
- 平方根变换:用于计数数据或中度右旋
- Box-Cox变换:各种非正常模式的灵活办法
使用非参数测试:这些测试并不认为是正常的:
- Mann-Whitney U测试(而不是独立的 t测试)
- Wilcoxon 签名排名测试(而不是配对 t测试)
- Kruskal-Wallis测试(而不是单向ANOVA)
诱饵方法:不需要分配假设的再取样技术
强有力的统计方法:设计用来减少外部和偏离正常的技术

正常测试的实际应用

质量控制

在制造业,正常度测试有助于核查生产过程是否稳定和可预测。非正常结果可能表明需要调查的程序问题。

科学研究

研究人员使用常态测试来确保统计分析的有效性,特别是在医学,心理学和社会科学等领域.

金融分析

测试收益的正常程度对风险评估、组合优化和融资选择定价模式至关重要。

环境监测

环境数据往往需要进行常态测试,以确定适当的统计方法来发现趋势或阈值超过。

最佳做法摘要

总是将统计测试与视觉方法(图像、Q-Q地块)结合起来
根据样本大小和分析需要选择适当的测试
考虑非常态的实际意义,而不仅仅是统计意义
在研究和报告中记录您的正常度评估过程
在有疑问时,考虑与统计学家协商进行复杂的分析

概念

什么是正常吗?

一个正态分布(也叫高斯分布)是一种以对称的钟形曲线为特征的连续概率分布. 它被定义为它的平均值和标准偏差.

关键特征:

钟形曲线
平均数对称
68% 1个标准差内的数据
95% 2个标准差内的数据
99.7% 3个标准差内的数据

指南

常态测试

Shapiro- Wilk 测试

对小样本而言最好(n)< 50)

安德森-达林测试

对更大的样本有好处

科尔莫戈罗夫-斯米尔诺夫测试

用于任何样本大小的工作

指南

解释结果

P-价值解释

p值 > α: 未能拒绝正常
p值 α: 拒绝常态
共同α值:0.01、0.05、0.1

实例

共同实例

实例1通常分发的数据

数据:[1、2、2、3、3、3、3、4、4、5]
结果:可能正常(p值 > 0.05)

实例2断层数据

数据: [1、1、1、2、2、3、4、5、10]
结果:非正常(p值)< 0.05)

实例3双模式数据

数据: [1, 1, 1, 2, 2, 8, 9, 9, 10]
结果:非正常(p值)< 0.05)

工具

统计计算器

Z Score To P Value Covariance Variance Normality Severity

还需要其他工具吗?

找不到你需要的计算器吗? 联系我们建议其他统计计算器。

正常计算器

正常性测试

目录

标准测试综合指南

为什么测试正常度?

正常度测试的关键原因:

常见 测试已解释

Shapiro- Wilk 测试

如何运作:

公式:

口译:

安德森-达林测试

如何运作:

福利:

口译:

科尔莫戈罗夫-斯米尔诺夫 测试

如何运作:

主要特征:

何时使用:

比较测试性能

如何解释测试结果

当数据显示正常时

数据显示非正常时

重要的考虑

处理非正常数据

正常测试的实际应用

质量控制

科学研究

金融分析

环境监测

最佳做法摘要

什么是正常吗?

常态测试

Shapiro- Wilk 测试

安德森-达林测试

科尔莫戈罗夫-斯米尔诺夫 测试

解释结果

P-价值解释

共同实例

实例1通常分发的数据

实例2断层数据

实例3双模式数据

统计计算器

还需要其他工具吗?

常见测试已解释

科尔莫戈罗夫-斯米尔诺夫测试

科尔莫戈罗夫-斯米尔诺夫测试