統計分析で道具変数(instrumental variable)を用いて内生性(endogeneity)を解決する方法

以前、経営戦略論に代表される経営学の実証分析において、統計モデルに内生性が存在する場合、結論において重大な誤りを犯す危険性を説明した。

経営戦略論で内生性(endogeneity)が大きな問題となるのは何故か

 

そこで重要となるのが、何らかの方法で内生性の影響を取り除くことで適切な結論を導き出すことである。おさらいをすると、内生性とは、重回帰分析において、独立変数(x)と予測誤差(e)とに相関がある場合、独立変数による効果の推定にバイアスが生じてしまう現象を指す。意味的にいうと、外生変数(exogneous variable)が、モデルにおいて因果関係の始点となる変数なのに対し、内生変数(endogeneous variable)は、たとえそれが因果モデルの原因の側にあるとしても、それが他の変数からも影響を受けている(よって始点ではなく、他の変数から見ると終点)ような変数である。実証分析において、このような他の変数が特定できていなかったり測定できていなかったりして、予測誤算の中に紛れこんでいると思われる点が問題をややこしくしている。

 

内生性を取り除いて適切な結論を導くための方法として、今回、直感的な理解を目指すのが、道具変数(instrumental variable)を用いた2段階の最小二乗法である。最初にもっとも直感的な説明をざっくりと言ってしまうと、この方法は、独立変数と予測誤差が相関していることがすべての災いの元になっているのだから、その相関部分を取り除いてしまってクリーンにした「疑似的な独立変数」を作って、それを重回帰分析に入れてあげれば問題は解決する(独立変数と予測誤差が相関しなくなるので、適切な結論を導ける)というものである。「疑似的な」独立変数というところがミソで、これを作り出すために使うのが、道具変数なわけである。

 

つまり、分析の際に、なんとかして最適な道具変数を見つけ出すことができれば、内生性の問題はめでたく解決するというわけなのだが、そもそも道具変数とは何で、どのように見つけだすのかがポイントである。それは、おおまかに2つの条件を満たすような変数を見つけだすということである。1つ目は、その変数が、内生変数である独立変数と強く相関していることで、これが、独立変数と似ている「疑似的な変数を生み出す道具になる」ことに相当する。2つ目は、その変数は、予測誤差と相関していない、すなわち外生変数だということである。2つ目の条件があるからこそ、この変数を使って、予測誤差と相関しない疑似的な独立変数を作り出すことができるというわけである。

 

うまくこの2つの条件を満たす変数が見つかれば、それを道具変数として、2段階の回帰分析を使って内生性の問題の解決に取り組むことになる。それは、以下のようなメカニズムによって行われる。

 

まず、本来の独立変数(内生変数)をいったん従属変数として、あとは本来の重回帰分析と同じ統制変数と、道具変数を予測変数とする重回帰分析を最小二乗法で実施する。これが第一段階の回帰分析である。そうすることで、独立変数の値に近い、モデルの予測値を生み出すことができる。この予測値は、もともとの予測誤差と相関していない外生変数を用いて生み出した値なので、この値を本来の回帰分析に入れても予測誤差と相関することはない。

 

つまり、第二段階の回帰分析において、本来の独立変数に代えて、先ほどの第一段階の重回帰分析で作り出した予測値を用いて、重回帰分析を行うわけである。つまり、もともとの内生変数を、それと似ている外生変数に置き換えたというわけである。この置き換えられた変数を、疑似的な独立変数というならば、その意味は、もともとの内生性を有した独立変数と非常に似ている要素を有していながら、予測誤差と相関する部分のみが取り除かれてクリーンになった変数ということになる。

 

このような方法で第二段階の重回帰分析を行うならば、そこでは予測誤差との相関がなくなり、すなわち内生性の問題が除去され、バイアスのない、適切なかたちでの疑似的な独立変数の効果が推定できるのである。よって、本来の独立変数が従属変数に与える効果について、適切な結論を導き出すことが可能になるというわけである。道具変数というのは、モデルにおいて測定できていないような隠れた変数などによる影響で「汚染された」独立変数から、汚染部分を取り除いてクリーンにした変数を作り出してモデルを検証するための変数だといえるだろう。

 

文献

Bascle, G. (2008). Controlling for endogeneity with instrumental variables in strategic management research. Strategic organization, 6(3), 285-327.