统计测试是数据分析的重要组成部分。 它们帮助我们理解数据并得出有关人口的结论。 它们还用于研究变量关系和检验假设。 通常,它们是一种分析数据以确定两组之间是否存在显着差异的方法。 在示例的帮助下,我们将在这篇博文中讨论各种类型的统计测试及其意义。
什么是统计检验?
统计检验用于确定两组数据是否彼此显着不同。 统计测试通过采用各种统计测量来实现这一点,例如平均值、标准偏差和变异系数。 然后,统计测试会将计算出的统计量度与一组预定标准进行比较。 如果数据符合标准,统计检验将得出两组数据之间存在显着差异的结论。
根据所分析数据的类型,可以使用各种统计测试。 T 检验、卡方检验和方差分析检验是三种最常见的统计检验。
统计检验的类型
统计检验有多种类型:
#1。 参数统计检验
如果数据呈正态分布,则使用参数检验。
参数统计检验对总体参数和数据分布做出假设。 这些检验包括 t 检验、z 检验和 ANOVA 检验,它们假定数据呈正态分布。
Z检验
当方差已知且样本量较大时,使用 z 检验来确定两个总体均值是否不同。 使用 z 检验比较总体平均值。 使用的参数是总体均值和标准差。 Z 检验用于确认抽取的样本来自同一总体。
Ho:样本均值等于总体均值(零假设)
z = (x - ) / ( / n),其中 x = 样本平均值,u = 总体平均值,和 / n = 总体标准偏差。
如果 z 值小于临界值,则接受零假设; 否则,拒绝原假设。
T检验
t 检验比较两个样本的均值。 当总体参数(均值和标准差)未知时,使用 t 检验。
配对 T 检验用于比较来自同一人群的两个变量之间的差异(测试前和测试后分数)。 例如,在培训计划中,受训者在计划完成前后的表现得分。
独立 t 检验,也称为双样本 t 检验或学生 t 检验,是一种统计检验,用于确定两个不相关组的均值是否存在统计显着性差异。
例如,考虑比较人群中的男孩和女孩。
将单个组的平均值与单样本 t 检验中的给定平均值进行比较。 例如,如果给出了平均销售额,则可以检查销售额的增加和减少。
t = (x1 - x2) / (/ n1 + / n2),其中 x1 和 x2 分别代表样本 1 和 2 的均值。
方差分析检验
方差分析 (ANOVA) 是一种统计技术,用于确定两组或更多组的均值是否存在显着差异。 ANOVA 比较不同样本的均值以确定一个或多个因素的影响。 如果我们使用 t 检验而不是 ANOVA 检验,结果将不准确,因为有两个以上的样本。
在方差分析中,被检验的假设是 Ho:所有样本对都相同,即所有样本均值相等。
至少一对样本存在显着差异。
我们在方差检验中计算 F 值并将其与临界值进行比较
F= ((SSE1 - SSE2)/m)/ SSE2/nk,其中 SSE = 残差平方和。
m = 约束数
k 表示独立变量的数量。
#2。 非参数统计检验
当数据不是正态分布时,使用非参数统计检验。 卡方检验是非参数检验的一个例子。
卡方检验(2检验)
卡方检验比较两个分类变量。 计算卡方统计值并将其与卡方分布的临界值进行比较,您可以确定观测频率和预期频率是否存在显着差异。
Ho:变量 x 和 y 是独立的,是针对卡方检验的假设。
变量 x 和 y 并不相互独立。
卡方公式(o=观察到,e=预期)。
选择要使用的统计检验
以下是可帮助您确定要使用的统计测试的参数
#1。 研究问题
统计测试的选择取决于要回答的研究问题。 此外,研究问题将帮助您开发数据结构和研究设计。
#2。 零假设的发展
定义研究问题后,您可以创建零假设。 零假设意味着预期观察结果没有统计显着性。
#3。 研究方案的重要性
在开始研究方案之前指定显着性水平。 显着性水平决定了统计显着性,统计显着性定义了零假设是被接受还是被拒绝。
#4。 单尾与双尾的选择
您必须决定您的研究是单尾的还是双尾的。 如果您有明确证据表明统计数据指向一个方向,则必须使用单尾检验。 但是,如果预期差异没有明确的方向,则需要进行双尾测试。
#5。 将检查的变量数
统计测试和程序根据它们要分析的变量数量进行分类。 因此,在选择测试时,必须考虑要分析的变量数量。
#6。 数据类型
指定数据是连续的、分类的还是二元的很重要。 在连续数据的情况下,您还必须确定数据是服从正态分布还是偏态分布,以确定使用哪种统计检验。
#7。 研究设计,配对和非配对
当两个样本相互依赖时,配对设计包括对两个总体均值进行比较的比较研究。 两个样本的结果在非配对或独立研究设计中进行分组和比较。
既然您已经了解了选择统计检验的步骤,您就可以为您的研究问题找到正确的统计检验了。 由于每种情况都不同,因此了解您的所有选择并做出明智的决定至关重要。
如果您不确定要使用哪种测试,请始终咨询您的首席调查员、统计学家或软件。
什么是统计显着性检验?
统计显着性检验是分析人员做出的一项确定,即数据的结果不能完全由偶然来解释。 分析师使用统计假设检验做出此决定。 该测试返回一个 p 值,即假设结果完全是偶然的,即看到与数据中的结果一样极端的结果的概率。 5% 或更低的 p 值通常被认为具有统计显着性。
了解统计显着性检验
统计显着性是对零假设的确定,这意味着结果完全是偶然的。 当 p 值足够小时,数据集具有统计显着性。
当 p 值很大时,数据的结果完全可以通过偶然来解释,并且数据被认为与(但不是证明)原假设一致。
此外,当 p 值足够小时(通常为 5% 或更少),结果不能完全由偶然来解释,并且数据被认为与零假设不一致。 在这种情况下,拒绝将机会零假设单独作为对数据的解释,而支持更系统的解释。
统计显着性经常用于新药试验、疫苗测试和病理学研究,以进行有效性测试并告知投资者公司成功发布新产品。
统计显着性检验的例子
假设亚历克斯是一名金融分析师,他很好奇一些投资者是否知道一家公司即将倒闭。 亚历克斯决定比较公司失败前后的每日市场回报率的平均值,看看这两个平均值之间是否存在统计学上的显着差异。
该研究的 p 值为 28% (>5%),表明这种幅度的差异(-0.0033 至 +0.0007)在纯机会解释下并不罕见。 结果,数据没有提供令人信服的证据证明先前知道故障。 如果 p 值为 0.01%(远小于 5%),则观察到的差异在纯机会解释下将极不寻常。 在这种情况下,亚历克斯可能会选择拒绝零假设并调查一些交易员是否有先验知识。
统计显着性还用于评估新的医疗产品,例如药物、医疗器械和疫苗。 公开的具有统计意义的报告也让投资者了解公司在发布新产品方面取得的成功。
例如,假设一家专门从事糖尿病药物治疗的制药公司报告称,在测试其新胰岛素后,1 型糖尿病的发病率在统计学上显着降低。 该研究包括对糖尿病患者进行为期 26 周的随机治疗,p 值为 4%。 这告诉投资者和监管机构,数据显示 1 型糖尿病的统计显着减少。
哪些因素影响统计显着性?
为了确定数据是否具有统计显着性,使用了统计假设检验。 换句话说,这种现象是否可以完全由偶然性来解释。 统计显着性是对原假设的确定,原假设表明结果完全是偶然的。 必须拒绝零假设才能使数据被认为具有统计显着性。
P值到底是什么?
p 值是对观察到的差异偶然发生的可能性的度量。 当 p 值足够小(例如,5% 或更少)时,结果不能完全由偶然来解释,零假设可以被拒绝。 当 p 值很大时,数据的结果完全可以通过偶然来解释,并且数据被认为与(并因此证明)原假设一致。
如何使用统计显着性?
统计显着性经常用于评估新医疗产品(例如药物、设备和疫苗)的功效。 公开的具有统计意义的报告也让投资者了解公司在发布新产品方面取得的成功。 制药公司的股票价格经常受到有关其新产品统计意义的公告的显着影响。
统计检验的三个主要种类是什么?
回归检验、比较检验和相关检验是统计检验的三个主要品种。
SPSS 中的统计检验是什么?
T 检验、卡方检验、相关性、回归和方差分析是 SPSS 中可用的统计检验。
统计中的两种主要方法是什么?
在统计学中,主要有两种方法:描述性统计,使用均值和中位数等指标汇总数据;推论性统计,使用学生 t 检验等统计检验从数据中得出结论。
方差分析是统计检验吗?
ANOVA 代表方差分析,是一种统计检验,用于比较多个组的均值。
结论
统计检验用于确定两组数据是否彼此显着不同。 统计检验分为两类:参数检验和非参数检验。 参数测试对数据做出假设,而非参数测试不对数据做出假设。 两种类型的测试都用于从样本中得出关于总体的结论。 要使用的测试类型取决于可用数据的类型。
相关文章
- 统计分析:类型、技术和目的
- 需求计划:概述、比较、薪水和工作
- 统计方法:您应该了解和指导的内容
- 用于员工筛查的最佳药物测试类型是什么?
- Quant Salary: 一个完整的细分 & 如何成为一个 Quant