RMSE(Root Mean Squared Error / 二乗平均平方根誤差)は、回帰モデルの評価指標として最も広く使われるデファクトスタンダードです。MSE の平方根を取ることで元のデータと同じ単位で解釈でき、大きな誤差を適切にペナルティする性質を持ちます。
RMSE とは何か
RMSE は √(Σ(yi - ŷi)² / n) で計算されます。MSE(平均二乗誤差)の平方根であり、元のデータと同じ単位を持ちます。例えば価格予測なら RMSE の単位は「円」であり、MSE の「円²」よりも直感的に解釈できます。
RMSE の直感的な解釈
RMSE は「予測誤差の標準偏差的な指標」と考えることができます。RMSE = 500万円 なら、誤差はおおむね ±500万円の範囲に収まることが多いと解釈できます。厳密には標準偏差とは異なりますが、誤差の「典型的な大きさ」の目安として有用です。
RMSE vs MAE — 外れ値感度の違い
5件の予測誤差が 100万、100万、100万、100万、500万 だとします。MAE = (100+100+100+100+500) / 5 = 180万。RMSE = √((100²+100²+100²+100²+500²) / 5) = √(290000/5) ≈ 241万。500万の外れ値により RMSE は MAE よりも大きくなり、大きな誤差をより強く反映しています。
RMSE が MAE より大きくなる理由
ジェンセンの不等式により、RMSE ≥ MAE が常に成り立ちます(等号は全誤差が同じ場合のみ)。二乗平均は算術平均以上になるという数学的性質です。この差が大きいほど、予測誤差のばらつきが大きい(一部の予測が大きく外れている)ことを示します。
RMSE / MAE 比率で外れ値を検出する
RMSE / MAE の比率は外れ値の存在を示すバロメータです。すべての誤差が同じなら RMSE / MAE = 1.0 です。比率が大きいほど、一部の予測が大きく外れていることを意味します。一般的に、比率が 1.2 を超える場合は外れ値の影響を調査すべきです。
NRMSE — 異なるスケールでの比較
- 1
範囲で正規化: RMSE / (y_max - y_min)
目的変数の範囲で割ります。値が大きく変動するデータで有用です。
- 2
平均で正規化: RMSE / ȳ(CV-RMSE)
目的変数の平均で割ります。相対的な誤差の大きさを示し、パーセンテージとして解釈できます。
- 3
IQR で正規化: RMSE / IQR
四分位範囲で割ります。外れ値の影響を受けにくい正規化方法です。
RMSLE — 右に裾の長い分布向け
RMSLE(Root Mean Squared Logarithmic Error)は予測値と実測値の対数を取ってから RMSE を計算します。売上予測や人口予測のように値が正で右に裾の長い分布のデータに適しています。大きな値の誤差よりも小さな値の誤差を相対的に重視するため、スケールの大きなデータでもバランスの取れた評価が可能です。
RMSE が Kaggle で主要指標になる理由
Kaggle のコンペティションでは RMSE が最も頻繁に使われる回帰指標です。その理由は、大きな誤差にペナルティを与えるため「全体的に安定した予測」を促進すること、MSE を損失関数とする多くのアルゴリズムと整合性があること、そして元のスケールで解釈できる実用性にあります。
RMSE の限界
RMSE はスケール依存であり、異なるタスク間の比較には NRMSE への変換が必要です。また、外れ値に敏感であるため、外れ値が多いデータでは MAE の方が安定した評価を提供します。RMSE だけでなく MAE や R² と併用して多角的に評価することが重要です。
Qast でのデフォルトソート指標としての位置付け
Qast のリーダーボードでは、回帰タスクのデフォルトソート指標として RMSE が使用されます。RMSE が小さいモデルほど上位に表示されます。MAE や R² でもソート可能で、タスクの特性に応じた指標でモデルを比較・選択できます。
RMSE は「典型的な最大誤差」の目安と考えましょう。MAE との差が大きければ、一部の予測が大きく外れている可能性があります。残差プロットで外れ値を特定し、データの品質を確認してください。




