样本量:定义、计算、指南和公式

样本大小
图片来源:数字营销学院

选择合适的样本量是任何研究中最关键的部分之一。 在统计学中,样本大小是实验中使用的单个样本的数量。 要获得可靠和准确的结果,请确保您的样本量足够大以提供有关所研究人群的重要信息。 为此,您必须首先掌握用于计算样本量的样本量公式。 此外,了解统计显着性的最小样本量至关重要,因为它会对您的发现的有效性和可靠性产生重大影响。

我们还将在本文中研究如何确定已知人群的样本量,这样您就可以确保您的研究项目稳健可靠。 那么,让我们开始探索所有关于样本量的信息吧!

样本量定义

样本量是指从人群中选择的参与者数量。 通常,研究人员选择一个大小来对整个人口进行推断。 此外,较大的模型尺寸往往会提供更准确和可靠的结果。

什么是样本量及其确定方式? 

样本量是指从人群中选出的参与研究的人数。 确定适当的抽样规模取决于几个因素,包括:

  • 研究问题,
  • 所需的精度水平, 
  • 人口的可变性,以及 
  • 所需的统计显着性水平。 

通常,较大的抽样规模会带来更可靠和准确的结果,但也会增加收集和分析数据所需的成本和时间。 因此,研究人员在为他们的研究确定合适的样本量时需要仔细权衡这些因素。

确定样本量的 4 种方法是什么? 

有几种方法可以确定研究性研究的适当抽样规模。 以下是 4 种常见的方法:

#1。 功率分析

此方法使用统计计算来估计检测具有给定统计功效水平的特定效应大小所需的抽样大小。

#2。 经验法则

此方法涉及使用基于先前研究、专家意见或实际考虑的预定抽样大小。

#3。 采样到饱和

这种方法涉及收集数据,直到新信息或见解不再出现,这表明抽样规模足够。

#4。 基于精度的样本量确定

此方法涉及指定所需的精度级别(通常由误差范围表示),然后计算实现该精度级别所需的样本大小。

为什么样本量是 30?

30 的样本量并不总是研究调查的最佳或最常见的样本量。 然而,研究人员在从正态分布的人群中收集定量数据时偶尔会将其用作经验法则​​,尤其是在某些领域,如心理学。 这是因为 30 或更大的抽样规模通常足以满足参数统计检验的假设,这要求数据服从正态分布。 另一方面,给定研究的理想抽样规模将取决于独特的研究主题、必要的精确度水平、人口变异性和所需的统计显着性水平。 因此,研究人员必须仔细考虑并证明为每个研究项目选择的抽样规模。

样本量公式 

根据您使用的统计测试和对总体所做的假设,有不同的公式可用于计算样本量。 以下是一些常见统计检验的样本量公式:

  1. 对于一个比例:

n = [(Z^2 * p * (1-p)) / E^2]

其中 n 是样本大小,Z 是所需置信度的 z 分数,p 是具有感兴趣属性的人口的估计比例,E 是所需的误差幅度。

  1. 平均而言:

n = [(Z^2 * σ^2) / E^2]

其中 n 是样本大小,Z 是所需置信水平的 z 分数,σ 是总体的估计标准差,E 是所需的误差范围。

  1. 对于手段的不同:

n = [2 * (Zα/2 + Zβ)^2 * (σ1^2 + σ2^2) / Δ^2]

其中 n 是样本大小,Zα/2 是所需置信度的 z 分数,Zβ 是所需功效级别的 z 分数,σ1 和 σ2 是被比较的两个总体的估计标准差, Δ 是期望的均值差。

请注意,这些公式只是一般准则,可能需要针对具体的研究问题和正在研究的人群进行更改。 此外,在确定合适的抽样大小时,考虑可用资源和时间等实际限制也很重要。

你如何计算样本量? 

为一项研究计算适当的抽样规模取决于各种因素,包括研究问题、所需的统计显着性水平以及人口的可变性。 以下是有关如何计算样本量的一般步骤:

  • 确定研究所需的统计显着性水平(通常表示为 alpha 或 α)。
  • 确定研究所需的功效水平(通常表示为 beta 或 β)。
  • 估计正在研究的变量的影响大小。
  • 确定所研究人群的变异性。
  • 选择适当的统计测试来分析数据。
  • 使用特定于所选统计测试的样本大小公式,并插入前面步骤中的值。
  • 计算所需的样本量。

根据所使用的统计检验,例如 t 检验、方差分析或回归分析,有多种抽样大小公式。 专家建议咨询统计学家或使用样本量计算器来确保您确定合适的样本量。

两种类型的样本量是什么? 

两种类型的抽样规模是概率样本规模和非概率样本规模。

在概率抽样规模中,研究人员从较大的总体中随机选择样本,并且总体中的每个成员都有平等的机会参与样本。 概率抽样方法包括简单随机抽样、分层抽样、整群抽样和系统抽样。 概率抽样被认为更能代表总体,通常在研究中更受欢迎。

另一方面,非概率抽样规模是研究人员不会从总体中随机选择的规模,并且不会为总体中的每个成员提供平等的纳入机会。 非概率抽样方法包括方便抽样、目的抽样、滚雪球抽样和配额抽样。 研究人员通常认为非概率抽样对总体的代表性较低,并在概率抽样方法不可行或不合适时使用它。

哪些因素会影响样本量?

研究项目的适当抽样规模也会受到许多因素的影响。 在决定模型大小时,需要考虑的一些最重要的标准是:

#1。 人口规模

创建代表性抽样所需的抽样规模也可能受到被调查人口规模的影响。 为了获得相同程度的精确度,更大的人口将需要更大的抽样规模。

#2。 人口的变异性

被调查人群中的变异水平会影响所需的抽样规模。 研究人员需要更大的样本量才能从变化更大的人群中获得具有代表性的样本。

 #3。 研究问题

所需的抽样规模也取决于所调查的研究问题。 对于一个复杂的研究对象,可能还需要更大的样本量才能达到可接受的统计功效。

#4。 所需的精度水平

所需的抽样规模受所需精度水平的影响。 然而,为了获得适当程度的统计功效,较低的误差范围需要较大的模型大小。

#5。 使用的统计测试

用于检查数据的统计测试将对所需的模型大小产生影响。 但是,各种统计测试具有不同的模型大小要求。

#6。 成本和时间限制

可用资源(例如预算和时间)会影响所需的模型大小。 更大的样本也可能是昂贵和耗时的,并且在可用资源的情况下可能无法实现。

#7。 伦理道德问题

人类主体保护等道德因素可能会影响所需的模型大小。 在某些情况下,较小的模型尺寸也可能更可取,以减少对人类参与者的危险。

您如何选择研究样本量?

选择合适的研究样本量取决于几个因素。 首先,您需要确定研究问题和所需的精确度。 然后,您可以使用样本量公式或统计软件,根据人口的可变性和所使用的统计检验等因素,计算具有统计显着性的最小样本量。 此外,在确定适当的样本量时,必须考虑可用资源和时间等实际限制以及道德方面的考虑。 较大的抽样规模通常会增加统计功效并提高样本的代表性,但它也需要更多的资源并且可能并不总是可行的。

您如何手动计算样本量?

要手动计算样本量,您需要使用基于研究问题、所需精度水平以及总体可变性的公式。 最常用的公式是:

n = (Z^2 * p * q) / E^2

其中:

n = 样本量

Z = 对应于所需置信水平的标准正态分布的 z 分数(例如,1.96% 置信水平为 95)

p = 具有感兴趣特征的人口的估计比例

q = 1 – p

E = 误差范围

要使用此公式,您需要根据以前的研究或试点数据估计 p 和 q 的值,并选择所需的置信度和误差范围。 获得这些值后,您可以将它们代入公式并求解 n。

例如,如果要估计总体中患有某种疾病的比例,误差范围为 5%,置信水平为 95%,而您估计该比例为 0.5,则可以按如下方式计算所需样本:

n = (1.96^2 * 0.5 * 0.5) / (0.05^2) = 384.16

四舍五入到最接近的整数,所需的样本量为 385。

如何确定已知人群的样本量

有多种方法可以确定已知人群的样本量,从而为已知人群找到最佳样本。 第一步是确定所需的精度。 这需要确定样本均值与总体均值的接近程度。 通常通过考虑研究主题的性质和抽样误差对结果的潜在影响来选择所需的精度。

然后必须确定必要的置信水平。 这是样本均值也在总体均值的特定范围内的概率。 通常采用 95% 的置信水平,这也意味着样本均值有 95% 的可能性落在总体均值的某个范围内。 在确定所需的精度水平和所需的置信水平后,必须计算人口规模。 这也可以通过使用人口普查数据或根据过去的研究或其他可获得的数据估算人口规模来实现。

最后,为了建立合适的样本量,可以使用样本量计算器。 这些计算器考虑了所需的精确度、所需的置信度、人口规模以及任何其他相关标准,例如抽样技术和预期响应率。 你也可以使用 样本量 公式或 统计 软件来计算 最小样本量 统计学意义 基于人口的可变性和 统计 正在使用的测试。

常见问题

什么是合适的样本量?

一项研究的适当样本量取决于几个标准,包括研究主题、研究设计、数据可变性和所需的统计显着性水平。

什么是研究样本量的例子?

在统计学中,样本大小是实验中使用的单个样本的数量。 例如,如果我们要测试在一个城市看电视的 80 人,则样本量为 80。

样本量和响应数是否相同?

尽管研究主题相关,但样本量和响应者不同。 研究样本量是单位或观察的数量。

参考资料

发表评论

您的电邮地址不会被公开。 必填带 *

你也许也喜欢