企業は、データをよりよく理解するために、Excel を使用して統計を整理することがよくあります。 データを範囲内の XNUMX つのカテゴリに分割する四分位数関数は、スプレッドシートで使用する関数の XNUMX つです。 四分位数を理解すると、この計算が数値データに新しい洞察を提供できるかどうかを判断するのに役立ちます。 この記事では、四分位数とは何か、簡単な例、計算方法、知っておくべきその他の基本的な事実の中でその目的について説明します。 進みましょう!
四分位数とは何ですか?
四分位数は統計用語で、データ値に基づいて定義された XNUMX つの間隔にオブザベーションを分割し、オブザベーション セット全体とどのように比較するかを表します。
四分位数は、数値を 25 つのセクションに分割する Excel の値です。 人々はパーセンタイルよりも四分位数を好みます。たとえば、最も支出額の多い顧客の上位 XNUMX% などです。 XNUMX つの四分位数は次のとおりです。
- 最初の四分位数: 最初の四分位数には、データ範囲の下位 25% が含まれます。
- 第 XNUMX 四分位数: XNUMX 番目の四分位数には、次に低い数字のグループが含まれます。 このグループには、データ セットの中央値までの数値が含まれます。
- 第XNUMX四分位数: XNUMX 番目の四分位数は、中央値よりも高い数値の XNUMX 番目に高いグループです。
- 第 XNUMX 四分位数: 25 番目の四分位には、データ範囲内の数値の上位 XNUMX% が含まれます。
たとえば、データの範囲が XNUMX ~ XNUMX の場合、それぞれが次の四分位数のいずれかに分類されます。
- 第 1 四分位数: 2 と XNUMX
- 第 3 四分位数: 4 および XNUMX
- 第 5 四分位数: 6 と XNUMX
- 第 7 四分位数: 8 と XNUMX
四分位数の仕組み
四分位はデータを四分位に分割します。中央値がデータを半分に分割するのと同じように、測定値の 25% が下の四分位より小さく、50% が中央値より小さく、75% が上の四分位より小さくなります。測定値の 50% が中央値を下回り、50% が中央値を上回っています。
データ セットは 25 つの範囲に分割され、それぞれがデータ ポイントの 1% を含み、2 つの四分位値 (下限、中央値、上限) を使用します。 下位四分位または第 3 四分位は QXNUMX として示され、データセットの最小値と中央値の間の中間の数値です。 中央値も第 XNUMX 四分位数 QXNUMX にあります。 QXNUMX として示される上位または第 XNUMX 四分位数は、中央値と最大数の間にある分布の中心点です。
これで、四分位数によって形成された 1 つのグループをマッピングできます。 値の最初のセットには、Q1 までの最小数が含まれます。 3 番目のセットには、Q3 から中央値までが含まれます。 XNUMX 番目のセットには、QXNUMX までの中央値が含まれます。 XNUMX 番目のカテゴリには、セット全体で QXNUMX から最高のデータ ポイントまでが含まれます。
四分位数の目的は何ですか?
四分位数は驚くほど便利で、さまざまな状況で目的を果たすことができます。 四分位数の良い目的の XNUMX つは、データセットの中心的な傾向と変動性を理解し、外れ値を見つけるのにも役立つことです。 それらを箱ひげ図でグラフ化すると、データの分布を理解するのに役立ちます。
Q2 は中央値で、データセットを半分に分割します。 歪んだ分布の場合、これは中心傾向の有用な尺度です。 四分位範囲 (IQR) は変動性の尺度です。 第 XNUMX 四分位数と第 XNUMX 四分位数の間の間隔。
IQR = 第 3 四半期 – 第 1 四半期
IQR が大きいほど、値の範囲が広いことを示します。 分布の形状に関係なく、観測値の半分は四分位範囲内にあります。
中央値と四分位範囲は、よく知られている平均値と標準偏差よりも確実な尺度です。 外れ値は、すべての値に依存しているわけではないため、どちらの統計にもほとんど影響しません。 さらに、四分位範囲は、中央値などの歪んだ分布に最適です。
四分位数のもう XNUMX つの良い目的は、外れ値を見つけるのにも役立つことです。
Excelで四分位数を見つける方法
Excel で四分位数を検索する場合、いくつかのオプションがあります。
#1。 数字を並べ替える
データ範囲の数値を最低から最高の順に並べることで、四分位数を取得できます。 スプレッドシートでは、これらを列で並べ替えることができます。 たとえば、数値は次のようになります。
A | B | |
1 | 9 | 1 |
2 | 1 | 3 |
3 | 3 | 3 |
4 | 5 | 5 |
5 | 7 | 6 |
6 | 6 | 7 |
7 | 2 | 9 |
四分位の数式には、四分位と配列の 0 つの主要な値が必要です。 各四分位数は、異なる値のセットを表します。 これらには 4 から XNUMX までの番号が付けられています。
- 0: 数値範囲の最小値。
- 1: これは、最初の四分位または 25 パーセンタイルです。
- 2: これは 50 番目または中央四分位、または XNUMX パーセンタイルです。
- 3: これは 75 パーセンタイルまたは XNUMX 番目の四分位数です。
- 4: これは範囲内の最高値です。
#2。 タスクを実行する
Excel では、四分位関数は任意のデータ セットの四分位数を返します。 Excel では、次の式を使用して四分位数を計算します。
=QUARTILE(配列, クォーツ)
どこ:
- 配列 四分位数を求める値の範囲全体を表します。
- クォート 検索する四分位数です。
Excel で四分位数関数を使用するためのヒント
Excel の四分位数関数を使用するためのヒントを次に示します。
#1。 値を見直す必要があります。
四分位数関数を実行する前に、数値が XNUMX つの列で昇順になっており、正しいことを再確認してください。 いずれかのセルが空の場合、またはテキストまたは特殊文字が含まれている場合、関数はエラー メッセージを生成します。 コマンドのクォートの値が XNUMX 未満または XNUMX より大きい場合、エラー メッセージが表示されることがあります。
#2。 さまざまなクォートを決定する
各クォートは、使用できる固有のデータを提供できます。 たとえば、顧客がショッピング パーセンタイルの最も低いパーセンタイルと高い四分位で費やした金額を知りたい場合があります。 これは、特定のグループを対象とする特定のビジネス目標を作成する方法を決定するのに役立ちます。 広範囲のデータの各四分位数を計算すると、データ セット内の変動が示されるため、平均や中央値よりも多くの情報が表示されます。
#3。 精度を手動で確認します。
データを検証するために、次の式を使用して四分位数を手動で計算できます。
- 下位四分位数 = (N+1) x 1/4
- 中間四分位数 = (N+1) x 2/4
- 上位四分位数 = (N+1) x 3/4
数値 N は、データ セット内の整数の数を示します。 結果は、各位置がどの四分位を表すかを示します。 たとえば、下の四分位の式で結果が XNUMX になる場合、シーケンスの XNUMX 番目の数値が下の四分位になります。 第 XNUMX 四分位数は範囲内の最大値であるため、計算式はありません。
四分位数の例とは?
1 歳から 6 歳の子供の言語発達に関する小さな研究を行うことを検討してください。 あなたは研究に関する論文を書いており、子供たちの年齢の四分位数を含めたいと考えています。
年齢(歳) | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
周波数 | 2 | 3 | 4 | 1 | 2 | 2 |
#ステップ 1: データセット内の観測数をカウントします
n = 2 + 3 + 4 + 1 + 2 + 2 = 14
#ステップ 2: 観測値を昇順に並べ替えます
1、1、2、2、2、3、3、3、3、4、5、5、6、6
#ステップ 3: 最初の四分位数を見つけます
n * (1 / 4) = 14 * (1 / 4) = 3.5
3.5 は整数ではないため、Q1 は位置 4 の数値です。
1、1、2、 2、2、3、3、3、3、4、5、5、6、6
第 1 四半期 = 2 年
#ステップ 4: XNUMX 番目の四分位数を見つけます
n * (2 / 4) = 14 * (2 / 4) = 7
7 は整数なので、Q2 は 7 番目と 8 番目の数値の平均です。
1、1、2、2、2、3、 3, 3、3、4、5、5、6、6
Q2 = (3 + 3) / 2
第 2 四半期 = 3 年
#ステップ 5: XNUMX 番目の四分位数を見つけます
n * (3 / 4) = 14 * (3 / 4) = 10.5
10.5 は整数ではないため、Q3 は位置 11 の数値です。
1、1、2、2、2、3、3、3、3、4、 5、5、6、6
第 3 四半期 = 5 年
四分位数の解釈方法
四分位数は、特定の観測またはデータセットに関する有用な情報を提供できます。
#1。 観測値の比較
四分位数は、サンプルまたは母集団の残りの部分との関連で観測を理解するのに役立ちます。 四分位数と比較することで、観測値が下位 25%、中間 50%、上位 25% のいずれにあるかを判断できます。
#2。 中央値
中央値、または第 XNUMX 四分位数は、中心傾向の尺度です。 この中央の数値は、データの平均値または最も中心的な値の優れた指標であり、特に歪んだ分布や外れ値のある分布の場合に役立ちます。
#3。 四分位範囲 (IQR)
四分位範囲 (IQR) は、変動性の尺度です。 これは、第 50 四分位数と第 XNUMX 四分位数の間の距離です。 これは、データの中央 XNUMX% の分布を表します。
IQR = Q3 − Q1
IQR は、歪んだ分布または外れ値で満たされた分布の変動性の優れた尺度です。 IQR にはデータの中央の 50% のみが含まれるため、範囲とは異なり、極端な値の影響を受けません。
- 歪度: 四分位数間の距離は、分布が歪んでいるか対称であるかを示すことができます。
- 外れ値の特定: 外れ値は、四分位範囲 (IQR) を使用して識別できます。 外れ値は、極端に高いまたは極端に低い観測値です。 外れ値は、第 1.5 または第 XNUMX 四分位数から XNUMX IQR を超えて離れている観測として定義されます。
四分位数の式
XNUMX 番目、XNUMX 番目、XNUMX 番目、および四分位数を決定するために使用される XNUMX つの基本的な四分位式があります。
#1。 最初の四分位の場合、Q1 と略されます。
第 1 四分位数 = Q1 = ((n + 4) / XNUMX) 第 XNUMX 項
#2。 2 番目の四分位の場合、QXNUMX と略されます。
第 2 四分位数 = Q1 = ((n + 2) / XNUMX) 第 XNUMX 項
#3。 3 番目の四分位の場合、QXNUMX と略されます。
第 3 四分位数 = Q3 = (1(n + 4) / XNUMX) 項
#4。 四分位範囲の場合。
四分位数 = Q3 – Q1 = (3(n + 1) / 4) 項 – ((n + 1) / 4) 項
上記の XNUMX つの式を第 XNUMX、第 XNUMX、および第 XNUMX 四分位数に使用して、四分位数を計算する一般式を作成できます。
四分位はどのように計算されますか?
四分位数は、数式を使用して簡単に計算できます。
#1。 四分位数の例 1
指定されたデータ セットのすべての四分位数部分、2、9、7、29、34、61、25、19、16 を評価しますか?
ソリューション
- ステップ 1: 指定された一連の数字から始めます。
2、9、7、29、34、61、25、19、16
- ステップ2: 指定された数値セットを昇順に並べ替えます。
2、7、9、16、19、25、29、34、61
- ステップ 3: 与えられた数のセットを数え、n を掛けます。
N = 9
- ステップ 4: 四分位数の一般式を使用して、第 XNUMX、第 XNUMX、および第 XNUMX 四分位数を決定します。
Qk = k (n + 1) / 4) 第 XNUMX 項
- ステップ 5: 1 番目、2 番目、3 番目の四分位数に k = XNUMX、XNUMX、XNUMX を代入します。
k = 1 の場合
Q1 = 1 (9 + 1) / 4) 項
Q1 = 1 (10) / 4) 項
Q1 = (10) / 4) 項
Q1 = (5) / 2) 項
Q1=2.5期
k = 2 の場合
Q2 = 2 (9 + 1) / 4) 項
Q2 = 2 (10) / 4) 項
Q2 = (10 / 2) 項
Q2=5期
k = 3 の場合
Q3 = 3 (9 + 1) / 4) 項
Q3 = 3 (10) / 4) 項
Q3 = (30 / 4) 項
Q3 = (15 / 2) 項
Q3=7.5期
- ステップ 6: 四分位数の整理されたデータ セットから計算値を取得します。
Q1の場合
Q1=2.5期
Q1=第2期+第3期÷2
第 1 四半期 = 7 + 9/2
第 1 四半期 = 16/2
Q1 = 8
Q2の場合
Q2=5期
Q2 = 19
Q3の場合
Q3=7.5期
Q3 = 7 番目 + 8 番目 / 2
第 3 四半期 = 29 + 34 / 2
第 3 四半期 = 63/2
Q3 = 31.5
- ステップ7: 一般式を適用して四分位範囲を計算し、値を入力します。
四分位間 = 第 3 四半期 – 第 1 四半期
四分位間 = 31.5 - 8
四分位間 = 23.5
結果として、指定されたセットの四分位数は Q1 = 8、Q2 = 19、Q3 = 31.5、および四分位数 = 23.5 です。
#2。 四分位数の例 2
次のデータ セットの四分位数を見つけます: 23、19、3、12、22、18、11?
ソリューション
- ステップ 1: 指定された一連の数字から始めます。
23、19、3、12、22、18、11
- ステップ2: 指定された数値セットを昇順に並べ替えます。
3、11、12、18、19、22、23
- ステップ 3: 与えられた数のセットを数え、n を掛けます。
N = 7
- ステップ4: ここで、一般的な四分位数間式を適用します。
四分位範囲 = Q3 – Q1
- ステップ 5: XNUMX 番目と XNUMX 番目の四分位数を決定します。
Q1の場合
Q1 = (n + 1) / 4) 項
Q1 = (7 + 1) / 4) 項
Q1 = (8) / 4) 項
Q1=第2期
Q3の場合
Q3 = 3(n + 1) / 4) 項
Q3 = 3(7 + 1) / 4) 項
Q3 = 3(8) / 4) 項
Q3 = (24 / 4) 項
Q3=6期
- ステップ 6: 第 XNUMX および第 XNUMX 四分位数の結果を四分位数間式に入力します。
四分位間 =6期~2期
四分位間 = 22 - 11
四分位間 = 11
なぜ四分位と呼ばれるのですか?
四分位数は、データ ポイントの数をほぼ同じサイズの XNUMX つの部分 (XNUMX 分の XNUMX) に分割する、統計における分位数の一種です。 四分位数を計算するには、データを最小から最大の順に並べる必要があります。 したがって、四分位数は順序統計の一種です。
データを 4 つの四分位数に分割するにはどうすればよいですか?
Excel のシートのどこかにある空のセルをクリックします。 たとえば、セル B1 を選択します。 入力後に「=QUARTILE(A1:A10,1)」と入力します。
25%四分位とは何ですか?
25 パーセンタイルは、第 25 または下位の四分位数とも呼ばれます。 25 パーセンタイルは、回答の 75% がそれを下回り、回答の XNUMX% がそれを上回る値です。
5つの四分位数とは.
サマリーは、データ セットの最も極端な値 (最大値と最小値)、下位四分位数と上位四分位数、および中央値の 1 つの値で構成されます。 これらの値は、最小値、下位四分位数 (Q2)、中央値 (Q3)、上位四分位数 (QXNUMX)、最大値の順に表示されます。
最初の四分位数を見つける手順は?
次の手順を使用して、最初の四分位数を決定します。
- データ ポイントは、重要度の低いものから順に配置してください。
- データ セット全体の中央値を求め、それを XNUMX つの等しい部分に分割します。
- データセットの下半分の中央値を取ります。
四分位式は何に使用されますか?
一連の観測値は、四分位数の式を使用して XNUMX つの等しい部分に分割されます。 第 XNUMX 四分位数は、第 XNUMX 項と中央値の間に位置します。 中央値は XNUMX 番目の四分位数を表します。 XNUMX 番目の四分位数は、中央値と最後の項の間にある値です。
四分位をどのように使用するか?
四分位数は、母集団を分類するために販売および調査データで頻繁に使用されます。 たとえば、QUARTILE を使用して、母集団の収入の上位 25% を見つけることができます。
まとめ
この記事を読むだけで、四分位数に関連するすべての基本的な概念を把握できるようになりました。 このガイドでは、四分位数の目的と、例とその計算方法を含め、四分位数について知っておく必要があるすべてのことを、徹底的かつ順番に説明しました。 さらにサポートが必要な場合は、コメント欄に質問を残してください。
関連記事
- 平均住宅保険費用:2023年の英国のベストプラクティスと料金(更新)
- 兆ドルの企業が2019/2020をリスト
- 5 Cs of Credit:なぜそれらが重要なのですか? (+初心者向け詳細ガイド)
- YOY:前年比分析、成長と投資の計算、公式と例
- 2023 年の米国の家の価格はいくらですか。
- 自己評価: 詳細な説明と知っておくべきこと