活用テクニック2026年4月7日

R²(決定係数)完全ガイド — モデルの説明力を測る最重要指標

「モデルがデータの変動をどれだけ説明できるか」を 0〜1 で示す R²。計算式・負の値の意味・相関係数との関係・過学習の罠を詳しく解説します。

R²(決定係数)の概念図

R²(決定係数)は、回帰モデルが「データの変動をどれだけ説明できているか」を 0〜1 の範囲で示す指標です。RMSE や MAE が「誤差の大きさ」を測るのに対し、R² は「モデルの説明力」を測ります。分野や問題の難易度を問わず比較しやすい、非常に汎用的な指標です。

R² とは何か

R² は 1 - SS_res / SS_tot で計算されます。SS_res = Σ(yi - ŷi)² は残差平方和(モデルが説明できなかった変動)、SS_tot = Σ(yi - ȳ)² は全平方和(データ全体の変動)です。つまり R² は「全変動のうち、モデルが説明できた割合」を表します。

直感的な理解 — 平均値予測との比較

R² は「平均値で予測するよりどれだけ改善したか」を示します。R² = 0 はモデルが平均値予測と同程度であることを意味し、R² = 1 はモデルが完璧にデータを説明していることを意味します。例えば R² = 0.85 なら、データの変動の 85% をモデルが説明できているということです。

具体例: 不動産価格

不動産価格予測で R² = 0.85 なら、「不動産価格の変動の 85% を面積・築年数・立地などの特徴量で説明できている」ことを意味します。残りの 15% は、モデルに含まれていない要因(リフォーム状況、近隣の評判など)やランダムな変動です。

R² と相関係数 r の関係

単回帰(特徴量が1つ)の場合、R² = r²(ピアソン相関係数の二乗)が成り立ちます。相関係数 r = 0.9 なら R² = 0.81 です。ただし重回帰(特徴量が複数)では、この単純な関係は成り立ちません。重回帰の R² は各特徴量の寄与を総合的に反映した値になります。

R² が負になるケース

R² が負になることがあります。これは「モデルの予測が平均値予測よりも悪い」ことを意味します。つまり、モデルがデータの傾向を全く学習できていない、あるいは過学習したモデルを未知のデータに適用した場合に発生します。R² が負の場合は、モデルの根本的な見直しが必要です。

R² の数学的な性質 — 特徴量と単調非減少

R² は特徴量を追加すると単調に非減少します(下がることはない)。ランダムなノイズの特徴量を追加しても R² はわずかに上がります。これが R² の最大の落とし穴であり、特徴量を増やすだけで R² が改善したように見えてしまいます。この問題を解決するのが Adjusted R² です。

過学習との関係

訓練データの R² が非常に高い(例: 0.99)のにテストデータの R² が低い(例: 0.60)場合、過学習が起きています。モデルが訓練データのノイズまで記憶してしまい、未知のデータへの汎化性能が低下した状態です。訓練 R² とテスト R² の差を常に確認しましょう。

R² の限界

R² は非線形の関係がある場合に低くなることがあります。また、目的変数の分散が小さいデータ(値がほぼ一定)では、わずかな誤差でも R² が大幅に低下します。R² だけでなく、残差プロットで誤差のパターンを確認し、RMSE や MAE で誤差の絶対的な大きさも評価しましょう。

分野別の R² の目安

  1. 1

    社会科学: R² = 0.3〜0.5

    人間行動の予測は難しく、R² = 0.3 でも十分な成果とされます。

  2. 2

    工学: R² = 0.7〜0.9

    制御されたプロセスでは比較的高い R² が期待できます。

  3. 3

    物理法則: R² = 0.95+

    物理法則に基づく関係では非常に高い R² が達成可能です。

Qast でのホールドアウト R² の意味

Qast のリーダーボードに表示される R² は、ホールドアウトデータ(テストデータ)で計算された値です。訓練データではなく未知のデータに対する説明力を示すため、過学習の影響を反映した信頼性の高い指標です。R² が高いモデルは汎化性能が高いと判断できます。

訓練データとテストデータの R² に大きな差があれば過学習のサインです。Qast のリーダーボードではテストデータの R² が表示されるため、この値を信頼してモデルを選択しましょう。

Qast を導入してみませんか?

導入のご相談やデモのご依頼は、お気軽にお問い合わせください。