統計的検定: その意味、例、およびタイプ

統計検定
画像ソース: Course Downloader

統計検定は、データ分析の重要な要素です。 それらは、データを理解し、母集団に関する結論を導き出すのに役立ちます。 また、変数の関係を調査し、仮説をテストするためにも使用されます。 一般に、これらはデータを分析して、XNUMX つのグループ間に有意差があるかどうかを判断する方法です。 このブログ投稿では、例を使用して、さまざまな種類の統計テストとその重要性について説明します。

統計的検定とは

統計検定は、XNUMX つのデータ セットが互いに有意に異なるかどうかを判断するために使用されます。 統計検定では、平均、標準偏差、変動係数などのさまざまな統計的尺度を使用してこれを実現します。 次に、統計テストは、計算された統計的尺度を一連の所定の基準と比較します。 統計検定では、データが基準を満たしている場合、XNUMX つのデータ セット間に有意差があると結論付けられます。

分析するデータの種類に応じて、さまざまな統計テストを使用できます。 T 検定、カイ XNUMX 乗検定、および ANOVA 検定は、最も一般的な統計検定の XNUMX つです。

統計検定の種類

統計検定にはさまざまな種類があります。

#1。 パラメトリック統計検定

データが正規分布している場合は、パラメトリック検定が使用されます。

パラメトリック統計検定では、母集団パラメーターとデータ分布に関する仮定が作成されます。 これらの検定には、データが正規分布していることを前提とする t 検定、z 検定、および ANOVA 検定が含まれます。

Z検定

分散が既知で、サンプル サイズが大きい場合は、z 検定を使用して、XNUMX つの母平均が異なるかどうかを判断します。 母平均は、z 検定を使用して比較されます。 使用されるパラメーターは、母平均と標準偏差です。 Z 検定は、抽出されたサンプルが同じ母集団からのものであることを確認するために使用されます。

Ho: 標本平均は母平均に等しい (帰無仮説)

z = (x — ) / ( / n)、ここで、x = サンプルの平均、u = 母集団の平均、および / n = 母集団の標準偏差。

z 値が臨界値より小さい場合は帰無仮説を受け入れます。 それ以外の場合は、帰無仮説を棄却します。

T検定

t 検定は、XNUMX つのサンプルの平均を比較します。 母集団パラメーター (平均と標準偏差) が不明な場合は、t 検定が使用されます。

対応のある T 検定は、同じ母集団からの XNUMX つの変数 (検定前後のスコア) の差を比較するために使用されます。 たとえば、トレーニング プログラムでは、プログラム完了前後のトレーニーのパフォーマンス スコア。

独立 t 検定は、XNUMX 標本 t 検定またはスチューデントの t 検定とも呼ばれ、関連のない XNUMX つのグループの平均に統計的に有意な差があるかどうかを判断するために使用される統計検定です。

たとえば、集団内の男の子と女の子を比較することを考えてみましょう。

XNUMX つのグループの平均は、XNUMX サンプル t 検定で特定の平均と比較されます。 たとえば、平均売上が与えられている場合、売上の増減を調べることができます。

t = (x1 — x2) / (/ n1 + / n2)、ここで x1 と x2 はそれぞれサンプル 1 と 2 の平均を表します。

ANOVA 検定

分散分析 (ANOVA) は、XNUMX つ以上のグループの平均が互いに有意に異なるかどうかを判断するために使用される統計手法です。 ANOVA は、異なるサンプルの平均を比較して、XNUMX つ以上の要因の影響を判断します。 ANOVA 検定の代わりに t 検定を使用すると、サンプルが XNUMX つ以上あるため、結果が不正確になります。

ANOVA では、テストされる仮説は Ho です。サンプルのすべてのペアは同じです。つまり、すべてのサンプルの平均は同じです。

サンプルの少なくとも XNUMX つのペアが大幅に異なります。

Anova 検定で F 値を計算し、それを臨界値と比較します

F= ((SSE1 — SSE2)/m)/ SSE2/nk、ここで、SSE = 残りの二乗和。

m = 制約の数

k は独立変数の数を示します。

#2。 ノンパラメトリック統計検定

ノンパラメトリック統計検定は、データが正規分布していない場合に使用されます。 カイ二乗検定は、ノンパラメトリック検定の一例です。

カイ二乗検定 (2 検定)

カイ二乗検定は、XNUMX つのカテゴリ変数を比較します。 カイ XNUMX 乗統計値を計算し、それをカイ XNUMX 乗分布の臨界値と比較すると、観測度数と期待度数が有意に異なるかどうかを判断できます。

Ho: 変数 x と y は独立しており、カイ XNUMX 乗についてテストされている仮説です。

変数 x と y は互いに独立していません。

カイ二乗式 (o=観測値、e=期待値)。

使用する統計検定の選択

どの統計検定を使用するかを決定するのに役立つパラメーターを次に示します。

#1。 研究課題

統計的検定の選択は、回答する研究課題によって決定されます。 さらに、リサーチクエスチョンは、データ構造とリサーチデザインの開発に役立ちます。

#2。 帰無仮説の展開

リサーチ クエスチョンを定義した後、帰無仮説を作成できます。 帰無仮説は、期待される観測値に統計的有意性がないことを意味します。

#3。 治験実施計画書の重要性

研究プロトコルを開始する前に有意水準が指定されます。 有意水準によって、帰無仮説が受け入れられるか棄却されるかを定義する統計的有意性が決まります。

#4。 片側対両側の選択

研究が片側か両側かを決定する必要があります。 統計が一方向を指しているという明確な証拠がある場合は、片側検定を使用する必要があります。 ただし、予想される差の明確な方向性がない場合は、両側検定が必要です。

#5。 調べる変数の数

統計テストと手順は、分析対象の変数の数に基づいて分類されます。 そのため、検定を選択するときは、分析する変数の数を考慮する必要があります。

#6。 データ・タイプ

データが連続、カテゴリ、またはバイナリのいずれであるかを指定することが重要です。 連続データの場合、どの統計検定を使用するかを決定するために、データが正規分布しているか歪んでいるかを判断する必要もあります。

#7。 研究デザイン、対応のあるものとないもの

XNUMX つのサンプルが相互に依存している場合、対応のある計画には、XNUMX つの母平均を比較する比較研究が含まれます。 XNUMX つのサンプルの結果はグループ化され、対になっていない、または独立した研究デザインで比較されます。

統計テストを選択する手順を学習したので、リサーチ クエスチョンに適した統計テストを見つけようとしています。 状況はそれぞれ異なるため、すべての選択肢を理解し、十分な情報に基づいた決定を下すことが重要です。

どのテストを使用すればよいかわからない場合は、常に主任研究者、統計学者、またはソフトウェアに相談してください。

統計的有意性検定とは

統計的有意性検定は、データの結果が偶然だけでは説明できないことをアナリストが判断することです。 アナリストは、統計的仮説検定を使用してこの決定を行います。 このテストは、結果が完全に偶然によるものであると仮定して、データ内の結果と同じくらい極端な結果が表示される確率である p 値を返します。 5% 以下の p 値は、一般的に統計的に有意とみなされます。

統計的有意性検定について

統計的有意性は帰無仮説の決定であり、結果が偶然によるものであることを意味します。 p 値が十分に小さい場合、データセットは統計的有意性を提供します。

p 値が大きい場合、データの結果は偶然にのみ説明可能であり、データは帰無仮説と一致すると見なされます (ただし、証明はされません)。

さらに、p 値が十分に小さい場合 (通常は 5% 以下)、結果は偶然だけでは説明できず、データは帰無仮説と一致しないと見なされます。 この場合、データの説明としての偶然のみの帰無仮説は棄却され、より体系的な説明が支持されます。

統計的有意性は、新薬試験、ワクチン試験、および病理学研究で有効性試験のために頻繁に使用され、新製品のリリースにおける会社の成功について投資家に通知します。

統計的有意性検定の例

金融アナリストのアレックスが、投資家が会社の差し迫った破綻を認識していたかどうかに興味を持っているとします。 アレックスは、XNUMX つの平均値の間に統計的に有意な差があるかどうかを確認するために、会社が失敗する前と後の毎日の市場収益の平均を比較することにしました。

この研究の p 値は 28% (>5%) であり、この大きさの差 (-0.0033 から +0.0007) は偶然のみの説明では異常ではないことを示しています。 その結果、データは失敗の事前知識の説得力のある証拠を提供しませんでした。 p 値が 0.01% (5% よりはるかに小さい) である場合、観察された差は、偶然のみの説明では非常に珍しいものになります。 この場合、アレックスは帰無仮説を棄却し、一部のトレーダーが事前知識を持っていたかどうかを調査することを選択できます。

統計的有意性は、医薬品、医療機器、ワクチンなどの新しい医療製品を評価するためにも使用されます。 公開されている統計的に重要なレポートも、新製品のリリースにおける同社の成功について投資家に知らせます。

たとえば、糖尿病治療薬を専門とする製薬会社が、新しいインスリンをテストした後、統計的に有意な 1 型糖尿病の減少を報告したと仮定します。 この研究には、糖尿病患者を対象とした 26 週間の無作為化治療が含まれており、p 値は 4% でした。 これは投資家や規制当局に、データが 1 型糖尿病の統計的に有意な減少を示していることを示しています。

統計的有意性に影響を与える要因は何ですか?

データが統計的に有意であるかどうかを判断するには、統計的仮説検定が使用されます。 つまり、その現象が偶然だけで説明できるかどうか。 統計的有意性は、結果が完全に偶然によるものであると述べる帰無仮説の決定です。 データが統計的に有意であると見なされるには、帰無仮説を棄却する必要があります。

P値とは正確には何ですか?

p 値は、観測された差が偶然に発生した可能性の尺度です。 p 値が十分に小さい場合 (例: 5% 以下)、結果は偶然だけでは説明できず、帰無仮説は棄却される可能性があります。 p 値が大きい場合、データの結果は偶然にのみ説明可能であり、データは帰無仮説と一致していると見なされます (したがって、証明されます)。

統計的有意性はどのように使用されますか?

統計的有意性は、医薬品、デバイス、ワクチンなどの新しい医療製品の有効性を評価するためによく使用されます。 公開されている統計的に重要なレポートも、新製品のリリースにおける同社の成功について投資家に知らせます。 製薬会社の株価は、新製品の統計的有意性に関する発表によって頻繁に大きな影響を受けます。

統計検定の XNUMX つの主な種類はどれですか?

回帰テスト、比較テスト、および相関テストは、統計テストの XNUMX つの主な種類です。

SPSS の統計検定とは何ですか?

T 検定、カイ XNUMX 乗、相関、回帰、および分散分析は、SPSS で使用できる統計検定の XNUMX つです。

統計におけるXNUMXつの主な方法は何ですか?

統計学には、平均値や中央値などの指標を使ってデータを要約する記述統計と、スチューデントの t 検定などの統計検定を使ってデータから結論を導き出す推論統計の XNUMX つの主な方法があります。

ANOVA は統計的検定ですか?

分散分析の略である ANOVA は、複数のグループの平均を比較するために使用される統計テストです。

まとめ

統計検定は、XNUMX つのデータ セットが互いに有意に異なるかどうかを判断するために使用されます。 統計検定は、パラメトリック検定とノンパラメトリック検定の XNUMX 種類に分類されます。 パラメトリック検定はデータに関する仮定を行いますが、ノンパラメトリック検定はデータに関する仮定を行いません。 どちらのタイプの検定も、サンプルから母集団に関する結論を導き出すために使用されます。 使用するテストの種類は、利用可能なデータの種類によって決まります。

  1. 統計分析: 種類、手法、および目的
  2. 需要計画:概要、比較、給与、仕事
  3. 統計的方法: 知っておくべきこととガイド
  4. 従業員のスクリーニングに使用するのに最適な種類の薬物検査は何ですか?
  5. クオンツ給与:完全な内訳とクオンツになる方法

参考文献

コメントを残す

あなたのメールアドレスは公開されません。 必須フィールドは、マークされています *

こんな商品もお勧めしています