回帰分析を行うときにはすべての観測データは必要ない

誤解を招くようなタイトルなので、もう少し適切な言い方をすると、最も基本的な最小二乗法を用いた回帰分析を行って、定数や回帰係数の推定を行うとする場合、もともとの標本データの平均と標準偏差(分散)を計算して保持しておけば、後のデータは捨ててしまっても計算できるということである。


その理由は、最小二乗法を用いた回帰分析のパラメータの推定値を求める方法を実際に計算してみると、その計算式には、標本データの平均値と標準偏差(分散)しか出てこないからである。つまり、その式の中には、標本の実データの値はいっさい入っていない。したがって、標本データの平均と標準偏差(分散)という情報のみで、その種の回帰分析の実行が可能であるというわけだ。


もちろん、回帰分析に付随する各種分析を実施するためには、実データが必要になる場合があることは付記しておこう。