Anderson-Darling検定は、コルモゴロフ-スミルノフ検定(KS検定)を改良した適合度検定です。KS検定が累積分布関数の最大乖離のみに注目するのに対し、Anderson-Darling検定は分布全体にわたる乖離を重み付きで評価します。特に分布の裾(テール)部分に大きな重みを置くため、裾の形状の違いを検出する能力が高いのが特徴です。
裾に重みを置く仕組み
Anderson-Darling検定の統計量 A² は、経験的累積分布関数と理論分布の差を二乗し、重み関数で加重平均したものです。この重み関数は分布の両端(裾)で大きくなるように設計されています。なぜ裾が重要なのでしょうか?現実のデータでは、中央部分は正規分布に近くても、裾の部分で大きく外れるケースが多いためです。例えば、金融データでは「想定外の大暴落」が裾の厚さとして現れます。
KS検定との比較
KS検定は分布の中央部での乖離に敏感で計算もシンプルですが、裾の違いを見逃しやすい弱点があります。Anderson-Darling検定は裾の違いをしっかり捉えるため、正規性検定においてはKS検定よりも高い検出力を持ちます。一方でShapiro-Wilk検定と比較すると、小サンプルでの検出力ではやや劣る場合がありますが、大規模サンプルでも安定した性能を発揮します。
Qast の EDA 機能では、Anderson-Darling検定は正規性検定の補助として使用されます。特に「分布の裾が正規分布と異なるか」を確認したい場合に有効です。Shapiro-Wilk検定と合わせて確認することで、正規性の判断精度が向上します。

