Anderson-Darling検定入門 — 分布の裾に注目した適合度検定 | Qast ブログ

Anderson-Darling検定は、コルモゴロフ-スミルノフ検定（KS検定）を改良した適合度検定です。KS検定が累積分布関数の最大乖離のみに注目するのに対し、Anderson-Darling検定は分布全体にわたる乖離を重み付きで評価します。特に分布の裾（テール）部分に大きな重みを置くため、裾の形状の違いを検出する能力が高いのが特徴です。

裾に重みを置く仕組み

Anderson-Darling検定の統計量 A² は、経験的累積分布関数と理論分布の差を二乗し、重み関数で加重平均したものです。この重み関数は分布の両端（裾）で大きくなるように設計されています。なぜ裾が重要なのでしょうか？現実のデータでは、中央部分は正規分布に近くても、裾の部分で大きく外れるケースが多いためです。例えば、金融データでは「想定外の大暴落」が裾の厚さとして現れます。

KS検定との比較

KS検定は分布の中央部での乖離に敏感で計算もシンプルですが、裾の違いを見逃しやすい弱点があります。Anderson-Darling検定は裾の違いをしっかり捉えるため、正規性検定においてはKS検定よりも高い検出力を持ちます。一方でShapiro-Wilk検定と比較すると、小サンプルでの検出力ではやや劣る場合がありますが、大規模サンプルでも安定した性能を発揮します。

Qast の EDA 機能では、Anderson-Darling検定は正規性検定の補助として使用されます。特に「分布の裾が正規分布と異なるか」を確認したい場合に有効です。Shapiro-Wilk検定と合わせて確認することで、正規性の判断精度が向上します。

Anderson-Darling検定入門 — 分布の裾に注目した適合度検定

裾に重みを置く仕組み

KS検定との比較

関連記事

統計的検定の基礎 — Qast EDAで使われる検定手法を解説

コルモゴロフ-スミルノフ検定入門 — 累積分布の最大乖離を検定

Qast を導入してみませんか？