【統計】F検定とは?意味や使い方やt 検定との違いを初心者向けに徹底解説!

B!

統計解析でよく耳にする「F検定」。

このF検定の意味や使い方を正しく理解することは、データ分析や研究結果の評価において非常に重要です。

この記事では、初心者の方にもわかりやすいように、F検定の意味やt検定との違いについて具体例を交えて解説します。

目次

F検定ってそもそも何?

F検定とは、「2つ以上のグループのばらつき(分散)が同じかどうかを判定する統計手法」のことです。

「ばらつき?」「分散?」、わかりにくい用語が多いので、もう少し噛み砕いて説明します。

  • 「ばらつき(分散)」=データがどれくらい散らばっているかを示す指標のこと
  • 「分散が同じかどうか」=2つのグループで、データの散らばり具合が似ているか違うかを調べること

具体例:テストの点数で考える

例えば、AクラスとBクラスで数学のテストを実施したとします。

  • Aクラスの点数:50点、52点、48点、51点、49点(平均50点)
  • Bクラスの点数:30点、70点、40点、60点、50点(平均50点)

どちらのクラスも平均点は50点で同じですが、Bクラスの方が点数のばらつきが大きいですよね!?

このように、「平均は同じでも、ばらつきが違うかどうか」を統計的に判定するの F検定 なんです。

このF検定は、主に分散分析(ANOVA)の前提条件を確認する際や、2つのグループの変動の大きさを比較する際に活用されます。

Fは何の略? F検定の由来

F検定の「F」は、統計学者ロナルド・フィッシャー(Ronald Fisher)の頭文字に由来しています。

フィッシャーは20世紀初頭に活躍したイギリスの統計学者で、現代統計学の基礎を築いた人物です。

彼の功績を称えて、F分布F検定という名前が付けられました。

つまり、F検定は「フィッシャーが開発した分散を比較する検定方法」を意味しています。

スポンサーリンク

F検定で何がわかるの?

F検定を使うことで、主に以下の2つのことがわかります。

1. 2つのグループの分散(ばらつき)が等しいかどうか

「等分散性の検定」と呼ばれ、t検定 などの前提条件を満たしているか確認する際によく使われます。

  • F値が小さい(p値が大きい):2つのグループのばらつきはほぼ同じと判断できる
  • F値が大きい(p値が小さい):2つのグループのばらつきには明らかな差(有意差)があると判断できる

2. 3つ以上のグループ間で平均値に差があるかどうか

これは分散分析(ANOVA) でのF検定の使い方です。

複数グループの平均を一度に比較できます。

  • F値が大きい(p値が小さい):少なくとも1つのグループは他と平均が異なると判断できる
  • F値が小さい(p値が大きい):すべてのグループの平均は同じ程度と判断できる

一般的な統計検定では、p値が0.05未満なら統計的に有意(差がある)と判断されることが多いです。

F検定とt検定の違い

統計検定を学ぶ際、F検定 と t検定 はよく混同されやすい手法です。

両者の違いを整理しておきましょう。

何を比較するかが違う

F検定 と t検定の最も大きな違いは、「何を比較しているか」です。

  • t検定:2つのグループの平均値の差を比較する
  • F検定:2つ以上のグループの分散(ばらつき)を比較する、または3つ以上のグループの平均値を一度に比較する

具体例で理解する

先ほどのテストの例で考えてみましょう。

  • Aクラスの点数:50点、52点、48点、51点、49点(平均50点、ばらつき小)
  • Bクラスの点数:30点、70点、40点、60点、50点(平均50点、ばらつき大)

t検定を使う場合

「AクラスとBクラスで平均点に差があるかを知りたい」場合に使います。

この例では両クラスとも平均50点なので、t検定では「差がない」という結果になります。

F検定を使う場合

「AクラスとBクラスで成績のばらつきに差があるかを知りたい」場合に使います。

この例では明らかにBクラスの方がばらつきが大きいので、F検定を実施すると「ばらつきに有意な差がある」という結果になります。

比較できるグループ数が違う

もう1つの大きな違いは、比較できるグループの数です。

  • t検定:基本的に2つのグループの平均を比較する
  • F検定(分散分析)3つ以上のグループの平均を一度に比較できる

たとえば、A、B、Cの3つのクラスの平均点を比較したい場合:

  • t検定:AとB、AとC、BとCと3回検定する必要がある(多重検定の問題が発生)
  • F検定(ANOVA):1回の検定で3つすべてを比較できる

F検定とt検定の使い分け

実務では、以下のように使い分けます。

t検定を使うべき場面

  • 2つのグループの平均値に差があるかを知りたいとき
    • 例:「新薬を飲んだグループと飲まなかったグループで、平均血圧に差があるか?」

F検定を使うべき場面

  • 2つのグループのばらつき(分散)に差があるかを知りたいとき
    • 例:「2つの製造機械で作った部品の、寸法のばらつきに差があるか?」
  • 3つ以上のグループの平均値を一度に比較したいとき
    • 例:「A、B、C、3つの教授法で、成績の平均に差があるか?」

F検定とt検定の関係

実は、F検定とt検定には深い関係があります。

t検定を行う前の前提条件を確認するために、F検定を使うことがよくあります。

多くのt検定(特にスチューデントのt検定)は、「2つのグループの分散が等しい」という前提があります。

そこで

  1. まずF検定で「2つのグループの分散が等しいか」を確認
  2. 分散が等しければ→通常のt検定(等分散を仮定したt検定)を使う
  3. 分散が等しくなければ→ウェルチのt検定(等分散を仮定しないt検定)を使う

このように、F検定はt検定の「前準備」として使われることも多いのです。

まとめ:F検定とt検定の違い

項目 t検定 F検定
比較するもの 平均値の差 分散(ばらつき)の差、または3つ以上の平均
グループ数 2つ 2つ以上
使用場面 2グループの平均比較 分散の比較、多群の平均比較(ANOVA)
関係性 F検定で前提確認してから実施することも t検定の前提条件を確認するために使われる

このように、F検定とt検定は目的が異なる検定であり、状況に応じて適切に使い分けることが大切です。

F検定の計算する流れ

F検定の計算方法は「仮説→データ→F値→確率」というシンプルな流れで行います。

ここでは、2つのクラスの成績のばらつきを比較する例を使って、ステップごとにみていきましょう。

例:

例:2つのクラスの成績のばらつきを比較する場合

1. 帰無仮説を立てる

まずは「両クラスのばらつきは同じ」と仮定します。

これが帰無仮説(きむかせつ)です。

  • 帰無仮説:「AクラスとBクラスの成績のばらつき(分散)は等しい」

2. データを集めて分散を計算する

実際に両クラスのテスト結果からデータを集めます。

  • Aクラス:10人の点数から分散を計算 = 25
  • Bクラス:10人の点数から分散を計算 = 100

※分散は「各データが平均からどれだけ離れているか」を数値化したものです。

3. F値を計算する

F値は、2つの分散の比率で求めます。

F値 = 大きい方の分散 ÷ 小さい方の分散

この例では: F値 = 100 ÷ 25 = 4.0

4. F値からp値を求める

このF値が「偶然起こりうる範囲内か」を判定するために、F分布表統計ソフトを使ってp値を計算します。

  • たとえば計算の結果、p値=0.03(3%)だった場合
    • これは「両クラスのばらつきが本当に同じだとしても、このF値以上の差が偶然出る確率は3%」という意味
    • 「3%しか起きないなら、偶然ではなく本当にばらつきが違うかも!」と考えやすくなる

5. p値を計算する方法

この確率(p値)は手計算もできますが、普通は統計ソフトやExcelの関数を使います。

  • Excelの場合:「F.TEST」関数を使って、両グループのデータをそのまま指定すればp値が出ます
  • RやPythonなどでも簡単にF検定のp値を出すことができます。

    例:2つのクラスの成績のばらつきを比較する場合

    1. 帰無仮説を立てる

    まずは「両クラスのばらつきは同じ」と仮定します。

    これが帰無仮説(きむかせつ)です。

    • 帰無仮説:「AクラスとBクラスの成績のばらつき(分散)は等しい」

    2. データを集めて分散を計算する

    実際に両クラスのテスト結果からデータを集めます。

    • Aクラス:10人の点数から分散を計算 = 25
    • Bクラス:10人の点数から分散を計算 = 100

    ※分散は「各データが平均からどれだけ離れているか」を数値化したものです。

    3. F値を計算する

    F値は、2つの分散の比率で求めます。

    F値 = 大きい方の分散 ÷ 小さい方の分散

    この例では: F値 = 100 ÷ 25 = 4.0

    4. F値からp値を求める

    このF値が「偶然起こりうる範囲内か」を判定するために、F分布表統計ソフトを使ってp値を計算します。

    • たとえば計算の結果、p値=0.03(3%)だった場合
      • これは「両クラスのばらつきが本当に同じだとしても、このF値以上の差が偶然出る確率は3%」という意味
      • 「3%しか起きないなら、偶然ではなく本当にばらつきが違うかも!」と考えやすくなる

    5. p値を計算する方法

    この確率(p値)は手計算もできますが、普通は統計ソフトやExcelの関数を使います。

    • Excelの場合:「F.TEST」関数を使って、両グループのデータをそのまま指定すればp値が出ます
    • RやPythonなどでも簡単にF検定のp値を出すことができます。

2つのクラスの成績のばらつきを比較する場合

1. 帰無仮説を立てる

まずは「両クラスのばらつきは同じ」と仮定します。

これが帰無仮説(きむかせつ)です。

  • 帰無仮説:「AクラスとBクラスの成績のばらつき(分散)は等しい」

2. データを集めて分散を計算する

実際に両クラスのテスト結果からデータを集めます。

  • Aクラス:10人の点数から分散を計算 = 25
  • Bクラス:10人の点数から分散を計算 = 100

※分散は「各データが平均からどれだけ離れているか」を数値化したものです。

3. F値を計算する

F値は、2つの分散の比率で求めます。

F値 = 大きい方の分散 ÷ 小さい方の分散

この例では: F値 = 100 ÷ 25 = 4.0

4. F値からp値を求める

このF値が「偶然起こりうる範囲内か」を判定するために、F分布表統計ソフトを使ってp値を計算します。

  • たとえば計算の結果、p値=0.03(3%)だった場合
    • これは「両クラスのばらつきが本当に同じだとしても、このF値以上の差が偶然出る確率は3%」という意味
    • 「3%しか起きないなら、偶然ではなく本当にばらつきが違うかも!」と考えやすくなる

5. p値を計算する方法

この確率(p値)は手計算もできますが、普通は統計ソフトやExcelの関数を使います。

  • Excelの場合:「F.TEST」関数を使って、両グループのデータをそのまま指定すればp値が出ます
  • RやPythonなどでも簡単にF検定のp値を出すことができます。

ビジネスや日常でのF検定活用例

F検定は、研究だけでなく、実はビジネスや日常の様々な場面でも役立っています。

ここでは、代表的な活用シーンを具体的にご紹介します。

品質管理・製造業

製造ラインで作られる製品の品質が安定しているかを確認する際に、F検定が使われます。

たとえば、2つの製造機械で作った部品の寸法のばらつきを比較し、F検定で有意差があれば「片方の機械の精度が悪い」と判断できます。

これにより、早期の設備メンテナンスや工程改善に役立ちます。

マーケティング・A/Bテスト

複数の広告キャンペーンやウェブサイトのデザインを比較する際、それぞれの効果のばらつきをF検定で評価できます。

たとえば、「広告Aと広告Bで、クリック率の変動が同じかどうか」を検証し、ばらつきが異なれば「どちらかの広告の効果が安定していない」と判断できます。

医療・臨床試験

新薬の効果を検証する際、複数の治療法間で効果のばらつきを比較するのにF検定が使われます。

たとえば、「治療法A、B、Cで、患者の回復度にどれくらいの差があるか」を分散分析(ANOVA)で検定し、F値が大きければ「少なくとも1つの治療法は他と効果が異なる」と判断できます。

金融・投資

投資ポートフォリオのリスク管理において、複数の資産のリターンの変動(ボラティリティ)を比較する際にF検定が使われます。

たとえば、「株式AとBで、価格変動のばらつきに差があるか」を検証し、F値が大きければ「片方の資産の方がリスクが高い」と判断できます。

F検定の注意点

F検定は便利な指標ですが、使い方を誤ると誤解や間違った判断につながることがあります。

ここでは、特に注意すべきポイントをまとめます。

F検定はばらつきの差を見るもの

F検定は「分散(ばらつき)が等しいかどうか」を判定するためのものであり、平均値の差を直接調べるものではありません

平均値の差を調べたい場合は、t検定や分散分析(ANOVA)を使う必要があります。

データが正規分布に従うことが前提

F検定は、データが正規分布に従っていることを前提としています。

データが正規分布から大きく外れている場合、F検定の結果が信頼できなくなるため、事前にデータの分布を確認することが重要です。

サンプルサイズが小さいと精度が落ちる

サンプル数が少ない場合、F検定の結果は不安定になりやすく、誤った判定をしてしまうリスクが高まります。

可能な限り十分なサンプルサイズを確保することが推奨されます。

0.05未満はあくまで"目安"

p値が0.05未満なら有意」という基準は広く使われていますが、これは絶対的なルールではなく、分野や状況によって柔軟に考えるべきです

背景や目的に応じて、基準値を変えることもよくあります。

複数検定の場合は誤判定リスクに注意

たくさんの検定を同時に行うと、「偶然による有意差」が現れる確率が高くなります(多重検定問題)。

この場合はボンフェローニ補正などの方法で、p値の基準を厳しくする調整が必要です。

まとめ

F検定は統計解析における重要な手法で、正しく理解することでデータの意味をより深く読み取れます。

  • F検定は「2つ以上のグループの分散(ばらつき)が等しいかどうかを判定する統計手法」
  • Fは統計学者「フィッシャー(Fisher)」の頭文字に由来
  • F値が大きいほど「分散の差が大きい」=帰無仮説を否定しやすい
  • 一般にはp値0.05未満を「統計的に有意(差がある)」と判断することが多い
  • F検定は等分散性の検定や分散分析(ANOVA)で活用される
  • t検定は平均値の差を比較、F検定は分散の差や3つ以上の平均を比較
  • データが正規分布に従うことが前提条件
  • 具体例として、クラスの成績のばらつき比較や製品の品質管理などで使われる

F検定の理解は、統計を使ったビジネス意思決定の質を高める第一歩です。

ぜひ今回の内容を参考に、実際のビジネスや研究で活用してくださいね!

最新の記事はこちらから