MAPE(Mean Absolute Percentage Error / 平均絶対パーセント誤差)は、予測誤差をパーセンテージで表す評価指標です。「予測が平均何%ずれるか」という直感的な解釈が可能で、ビジネスの KPI 報告や非技術者への説明に最適です。ただし、重大な弱点もあるため、使いどころを正しく理解することが重要です。
MAPE とは何か
MAPE は Σ(|yi - ŷi| / |yi|) × 100 / n で計算されます。各サンプルの誤差を実測値で割ってパーセンテージ化し、その平均を取ります。例えば実測値 1000 に対して予測が 1100 なら、そのサンプルの寄与は |1000-1100|/1000 × 100 = 10% です。
MAPE の強み — パーセントで伝わる
MAPE の最大の強みは、スケールに依存しない「パーセンテージ」で表現される点です。「RMSE = 300万円」と言っても、3000万円の物件なら 10% ですが、3億円の物件なら 1% です。MAPE なら「予測が平均 5% ずれる」と一言で伝えられ、経営層やビジネス部門への報告に適しています。
具体例: 売上予測
5店舗の月間売上の実測値が 1000万、2000万、500万、3000万、1500万で、予測が 1100万、1900万、550万、2700万、1650万だとします。各誤差率は 10%、5%、10%、10%、10% で、MAPE = (10+5+10+10+10) / 5 = 9% です。「売上予測は平均 9% ずれる」と簡潔に伝えられます。
MAPE の致命的弱点: ゼロ除算問題
MAPE は実測値が分母にあるため、実測値がゼロまたはゼロに近い場合に値が無限大に発散します。例えば在庫予測で実際の需要がゼロの商品があると、MAPE は計算不能になります。気温予測(0℃を含む)やカウントデータ(0件がありうる)でも同様の問題が発生します。
MAPE の非対称性
MAPE には過小予測の方がペナルティが小さいという非対称性があります。実測値 100 に対して予測 150(50%の過大予測)と予測 50(50%の過小予測)を比較すると、過大予測の寄与は 50/100 = 50%、過小予測も 50/100 = 50% で同じに見えますが、系統的には過大予測を避けるバイアスがかかりやすい構造になっています。
sMAPE(対称MAPE)— 非対称性の補正
sMAPE は分母を |yi| + |ŷi| にすることで非対称性を緩和した指標です。ただし、sMAPE にも「両方がゼロの場合に不定になる」「定義が複数あり統一されていない」などの問題があります。万能ではありませんが、MAPE の非対称性が気になる場合の代替として使われます。
WMAPE(加重MAPE)— ゼロ除算回避
WMAPE は Σ|yi - ŷi| / Σ|yi| で計算されます。個別にパーセンテージ化するのではなく、誤差の合計を実測値の合計で割ります。これにより個別のゼロ除算を回避でき、全体的な誤差率を安定して計算できます。需要予測の業界で広く使われています。
MAPE の解釈基準
- 1
MAPE < 10%: 優秀
非常に高い予測精度です。多くのビジネスシーンで十分な精度と言えます。
- 2
MAPE 10〜20%: 良好
実用的な予測精度です。改善の余地はありますが、多くのタスクで許容範囲です。
- 3
MAPE 20〜50%: 合理的
大まかな傾向は捉えているが、精度に課題があります。特徴量の追加やモデルの改善を検討しましょう。
- 4
MAPE > 50%: 不正確
予測精度が低い状態です。データの品質、特徴量の選択、モデルの選択を見直す必要があります。
どのようなデータで MAPE を避けるべきか
実測値にゼロを含むデータ(在庫需要、来客数など)、ゼロ付近の値が多いデータ(気温、pH値など)、値の範囲が非常に広いデータ(10円〜1億円の売上など)では MAPE を避け、MAE や RMSE を使うのが安全です。
Qast での活用法
Qast のリーダーボードでは MAPE が回帰指標の一つとして表示されます。ビジネス報告に使いやすい指標ですが、リーダーボード上で MAPE が極端に大きい場合はゼロ近傍のデータの影響を疑い、MAE や RMSE と合わせて確認しましょう。
ゼロ付近の値が多いデータでは MAPE を避け、MAE や RMSE を使いましょう。ビジネス報告にパーセンテージが必要な場合は WMAPE が安全な代替手段です。


