R²（決定係数）完全ガイド — モデルの説明力を測る最重要指標 | Qast ブログ

R²（決定係数）は、回帰モデルが「データの変動をどれだけ説明できているか」を 0〜1 の範囲で示す指標です。RMSE や MAE が「誤差の大きさ」を測るのに対し、R² は「モデルの説明力」を測ります。分野や問題の難易度を問わず比較しやすい、非常に汎用的な指標です。

R² とは何か

R² は 1 - SS_res / SS_tot で計算されます。SS_res = Σ(yi - ŷi)² は残差平方和（モデルが説明できなかった変動）、SS_tot = Σ(yi - ȳ)² は全平方和（データ全体の変動）です。つまり R² は「全変動のうち、モデルが説明できた割合」を表します。

R² は「平均値で予測するよりどれだけ改善したか」を示します。R² = 0 はモデルが平均値予測と同程度であることを意味し、R² = 1 はモデルが完璧にデータを説明していることを意味します。例えば R² = 0.85 なら、データの変動の 85% をモデルが説明できているということです。

不動産価格予測で R² = 0.85 なら、「不動産価格の変動の 85% を面積・築年数・立地などの特徴量で説明できている」ことを意味します。残りの 15% は、モデルに含まれていない要因（リフォーム状況、近隣の評判など）やランダムな変動です。

単回帰（特徴量が1つ）の場合、R² = r²（ピアソン相関係数の二乗）が成り立ちます。相関係数 r = 0.9 なら R² = 0.81 です。ただし重回帰（特徴量が複数）では、この単純な関係は成り立ちません。重回帰の R² は各特徴量の寄与を総合的に反映した値になります。

R² が負になることがあります。これは「モデルの予測が平均値予測よりも悪い」ことを意味します。つまり、モデルがデータの傾向を全く学習できていない、あるいは過学習したモデルを未知のデータに適用した場合に発生します。R² が負の場合は、モデルの根本的な見直しが必要です。

R² は特徴量を追加すると単調に非減少します（下がることはない）。ランダムなノイズの特徴量を追加しても R² はわずかに上がります。これが R² の最大の落とし穴であり、特徴量を増やすだけで R² が改善したように見えてしまいます。この問題を解決するのが Adjusted R² です。

訓練データの R² が非常に高い（例: 0.99）のにテストデータの R² が低い（例: 0.60）場合、過学習が起きています。モデルが訓練データのノイズまで記憶してしまい、未知のデータへの汎化性能が低下した状態です。訓練 R² とテスト R² の差を常に確認しましょう。

R² は非線形の関係がある場合に低くなることがあります。また、目的変数の分散が小さいデータ（値がほぼ一定）では、わずかな誤差でも R² が大幅に低下します。R² だけでなく、残差プロットで誤差のパターンを確認し、RMSE や MAE で誤差の絶対的な大きさも評価しましょう。

Qast のリーダーボードに表示される R² は、ホールドアウトデータ（テストデータ）で計算された値です。訓練データではなく未知のデータに対する説明力を示すため、過学習の影響を反映した信頼性の高い指標です。R² が高いモデルは汎化性能が高いと判断できます。

訓練データとテストデータの R² に大きな差があれば過学習のサインです。Qast のリーダーボードではテストデータの R² が表示されるため、この値を信頼してモデルを選択しましょう。