独立変数間の交互作用を含む重回帰分析において、交互作用が有意になった場合に、その交互作用の特徴を理解するために行われる分析の一つが、単純傾斜分析(simple slope analysis)である。この手法は、経営学や組織行動論などにおいては頻出の分析であるといってよい。しかし、初心者が実際にデータを分析して論文を執筆しようとするときに意外と苦戦する分析でもある。分析の仕方がわからない、もしくは、分析のロジックがわからない、というのが多くの理由である。そこで、今回は、単純傾斜分析のロジックと分析方法を直感的に理解してみることにしよう。
まず、単純傾斜分析とは何かについて説明しよう。経営学や組織行動論などの研究で交互作用を含む重回帰分析を行う目的の多くが、独立変数と従属変数の関係を変化させる「調整変数」の効果を検定したいというものである。例えば、個人の性格が職務行動に影響を与えているのか、あるいはその度合いについて、その関係は常に一定であるわけではないと思われる。職場のルールが厳格であるときには、どんな性格であるかにかかわらず、決まった行動をすることが求められるので、本人の性格が職務行動に与える影響は弱いと予測される。しかし、職場のルールがあまりない場合、どんな行動をするのかは本人に任されているため、本人の性格が職務行動に与える影響は強いと考えられる。この例では、職場のルールの度合いが、個人の性格と職務行動との関係を調整する調整変数ということになる。
独立変数と調整変数を含む重回帰分析で交互作用が有意になった場合、確認すべきは、その交互作用がどのようなパターンを示しているのか、そしてそれが、予測や仮説と整合的であるかどうかということである。直感的にわかりやすいのは、ある調整変数の値を用いてグラフ化することである。例えば、調整変数が、その平均よりも1標準偏差高い場合に、独立変数と従属変数の関係はどうなのか、一方、調整変数が、その平均よりも1標準偏差低い場合に、独立変数と従属変数の関係はどうなのか。この2つを同じグラフ上に表して比べてみれば、調整変数の高低によって独立変数と従属変数の関係が変わることを視覚的に確認することができる。
単純傾斜分析(simple slope analysis)は、このような交互作用のパターンをさらに深く理解するための分析である。単純傾斜(simple slope)という言葉が示す通り、回帰直線の傾きを統計的に検定する手法であって、一言でいうと、「調整変数がある特定の値をとったときに、独立変数が従属変数に与える影響(単回帰分析の傾き:回帰係数)が統計的に有意かどうか」を検定することである。慣例としては、調整変数が連続変数のとき、平均+1標準偏差の値をとる場合と、平均ー1標準偏差の値をとる場合の2パターンを、もしくは、それに、調整変数が平均値であるときを加えた3パターンについて単純傾斜の検定を行うケースが多いが、必ずそうしないといけないというわけではない。原理的には、調整変数をどの値に設定してもよい。
では、単純傾斜分析をどのような手順で行えばよいのだろうか。もっとも単純な交互作用付きの重回帰式として、y = a + b1x + b2w + b3xw というものを考えてみよう。yは従属変数、aは切片、xは独立変数、wは調整変数、そして、b1~b3が偏回帰係数である。ポイントとしては、独立変数と従属変数のみで構成される単回帰式と比べると、wとxw (xとwの積)の項が回帰式に加わっているところである。この式を x の視点からあたかもwを含む項が定数であるかのように考えて変形すると、y = (a + b2w) + (b1 + b3w) x となる。つまり、yとxの関係について、切片が(a + b2w)で、傾きが(b1 + b3w)であると解釈することができる。ただし、切片にも傾きにも変数wが含まれているので、wの値によって切片の値も傾きの値も変化するということである。
上記の式でいうと、分析の結果b3が統計的に有意である場合、wの係数がゼロではないので交互作用がある(調整効果が存在する)ことが示唆されるので、単純傾斜分析で求めたいのは、wが特定の値(例えば平均+1標準偏差)のときに、傾き(b1 + b3w)がゼロではないか、すなわち統計的に有意かどうかである。統計学的には、wが特定の値のときの(b1 + b3w)を直接 t検定するのがいちばん素直な方法だが、t値を算出するときのロジックがやや難しい。そこで、以下に示すのがもっとも直感的にわかりやすい方法である。
wが平均+1標準偏差の値のときの単純傾斜分析を行うとすると、まず、wが平均+1標準偏差の値のときにw'=0となるような新たな変数w'を作成する。これは、w' = w - (平均 +1標準偏差) としてw'を作成すればよい。そして、wの代わりに、新しく作成したw'を使って再度重回帰分析を実行する。つまり、y = a + b1x + b2w' + b3xw' を新たに実行する。この式は、変形すれば y = (a + b2w') + (b1 + b3w') x となるわけだが、wが平均+1標準偏差の値のときにはどうなるだろうか。w'=0なので、y = a + b1 x になることがお分かりだろう。wが平均+1標準偏差の値のときに、yとxとの単回帰式になってしまうことがわかる。ということは、単純に、y = a + b1x + b2w' + b3xw'の分析結果としてb1が統計的に有意であるならば、wが平均+1標準偏差の値のときのy = a + b1 xの単純傾斜b1も統計的に有意だといえるわけである。つまり、単純傾斜分析とは、y = a + b1x + b2w' + b3xw'の分析を実行した場合のb1の有意性を検定することに他ならないのである。
もちろん、今回説明した単純傾斜分析の方法は、直感的にはわかりやすいが、手続きとしては新しい変数を作って重回帰分析を繰り返すのであまりエレガントではなくやや泥臭い感がある。であるが、誰かが作った単純傾斜分析のプログラムをそのメカニズムを理解できないまま半信半疑で使うことなく、自分自身で手順を踏んで分析のロジックに納得しながら単純傾斜分析を実行するときには便利だといえよう。
文献
Aiken, L. S., West, S. G., & Reno, R. R. (1991). Multiple regression: Testing and interpreting interactions. Sage.
Dawson, J. F. (2014). Moderation in management research: What, why, when, and how. Journal of Business and Psychology, 29(1), 1-19.