構造方程式モデリング(SEM)においてアイテムの小包化(parceling)をするべきか

構造方程式モデリングあるいは共分散構造分析は、経営学をはじめとする社会科学で頻繁に用いられる統計分析手法である。構造方程式モデリングを用いる利点の1つは、研究の対象となっている構成概念(実際は測定できない抽象的な概念であるが、なんらかの測定可能な項目によって把握するもの)どうしの因果関係や相関関係について、その測定誤差を取り除いたうえでの関係を検証することができる点にある。例えば、オーソドックスな重回帰分析の場合、測定された変数を足し合わせたり平均をとることによって構成概念を示す変数を作成してしまってから分析を行っているので、分析に測定誤差の存在が前提とされておらず、分析結果に測定誤差が混ざってしまう。つまり、これらの分析では、測定変数間の関係を検証することになるので、100%完璧に概念を測定しきれていない限りにおいては、本当に知りたい構成概念間の関係を把握しきれないことになる。しかし、構造方程式モデリングの場合、構成概念間の関係も測定誤差も両方とも1つのモデルで表現して分析するので、構成概念間の関係のみに着目するならば、そこには測定誤差が分析から除かれているため、真の構成概念間の関係を検証していることになるのである。


そこで、実際の研究で構造方程式モデリングを実施する際にしばしば用いられるのが、アイテムの小包化(パーセリング、parceling)というものである。これは何かというと、例えば、1つの概念を測定するのに10個の質問項目を用いているとする場合、標準では10個の項目をすべて構造方程式モデリングに含めるのであるが、何らかの方法を用いてこの数を減らす作業をするということである。つまり、分析に用いるべき複数の項目を包んで1つにしてしまう。例えば、因子負荷量が最大の項目と最小の項目の平均をとった項目を新たに作成し、残ったアイテムの中から因子負荷量が最大の項目と最小の項目の平均をとった項目を新たに作成するといったことを繰り返すと、10個の項目は5個に減る。これは小包化の一例にすぎないが、小包化の方法については、絶対的に正しい方法が存在するわけでもなく、かつ、実際の統計分析においてアイテムを小包化することが本当に適切なのかどうかについても、方法論的あるいは科学哲学的なスタンスによって賛否両論がある。


ではまず、なぜ研究者は実際の分析においてアイテムの小包化をしようとするのか。その理由は、構造方程式モデリングで推定しなくてはならないパラメータの数とサンプルサイズとの関係が絡んでいる。上記で示したように、構造方程式モデリングでは、構成概念間の関係と、測定された個々のアイテムと構成概念との関係の両方を含んだモデル全体のデータとの適合性を検証しようとするので、モデル自体が複雑で、推定しなくてはならないパラメータが非常に多い。サンプルサイズが十分に大きい場合にはそのような複雑なモデルであっても比較的安定した推定結果が得られるであろうが、経営学などの社会科学の多くでは、諸般の理由で十分なサンプル数が確保できな場合が多い。よって、ベストエフォートで収集された最大限のサンプル数を用いて、最善を尽くした統計分析を施すことによって統計学的推論を行う必要が出てくる。よって、アイテムの小包化によって、推定するべきパラメータの数を減らすことで、安定したパラメータ推定を実現しようとする。これが実務的には小包化をするもっとも多い理由であろう。例えば、Landis, Beal, & Tesluk (2000)による解説によると、1つのパラメータの推定において、5~10のサンプル数が必要だとの見解がある。仮に、サンプル数が100しかないとすると、推定するのに適したパラメータの数は、せいぜい10~20ということになる。これ以上推定すべきパラメータの数が多いと安定した推定ができない可能性が高まる。このように、推定が必要なパラメータ数に比してサンプル数がこの基準に満たない場合には、小包化によってこの基準に近づけようとする努力がなされる。


そのほか、サンプルサイズの問題以外の理由として、十分なサンプルサイズがあったとしても、測定アイテムが非常に多いと、想定した構成概念以外からも影響を受けるアイテムが出てきたり、通常はモデルで前提としないのだが、複数の測定誤差がお互いに相関したりする事態も生じたりするため、構造方程式モデル全体の適合度が落ちやすい。これを防いで、モデルの適合度を上げるために小包化を行うことも多い。小包化することでまとめたアイテムすなわち観測変数は、個々のオリジナルなアイテムよりも正規分布しやすいなど推定上の利点もある。つまり、どのような研究においても測定誤差がゼロということはありえないし、なんらかの測定上のズレが出てくるので、許容できる範囲内でやや多くの誤差が含まれる測定しかできなかったとしても、そこから最善の策で正しい統計学的な結論を導こうとする姿勢の表れであるともいえる。


構造方程式モデリングにおけるアイテムの小包化については賛否両論があると述べたが、まず、もっとも望ましくないのは、何の理由も考えず、盲目的に小包化をするということである。それを除けば、小包化が望ましい場合と、望ましくない場合があるだろう。これについても諸説あるが、シンプルな基準としてPhemtulla (2016)による解説を用いるならば、次のようになる。まず、研究の重点が、測定モデルの検証、すなわち、いかに質問紙などの測定方法が、知りたい構成概念を正確に測定できているかを検証することにあるのであれば、小包化は望ましくない。一方、研究の関心が、構成概念間の関係についての検証に焦点が当たっている場合には、小包化によって構造方程式を簡素化することで、サンプル数になどに適した推論が得られる可能性が高い。しかし、このような場合でも、小包化がいつでも望ましいわけではない。例えば、構成概念の測定自体の精度があまり高くない場合には、その影響が分析結果に出てしまい、不適切な結論に至る可能性がある。


冒頭で述べたオーソドックスな重回帰分析との比較を例にざっくりとしたイメージを言うならば、構造方程式モデリングの小包化をもっとも極端な形で行うと、すべての構成概念が限りなく測定された変数そのものに近づいていくので、オーソドックスな重回帰分析そのものとほぼ変わらないということになる。よって、オーソドックスな重回帰分析と比較した場合の構造方程式モデリングの有意性はなくなる。よって、アイテムの小包化を行った場合、それは、まったく小包化を行わない構造方程式モデリングと、オーソドックスな重回帰分析、あるいは、測定モデルを考慮しないパス解析モデルの中間のような感じになると考えればよいだろう。


要するに、構造方程式モデリングで小包化を実施することを検討する場合には、その長所、短所と、危険性を十分に検討したうえで、意思決定をする必要があるということである。小包化をするのが正しいのか間違っているのかというのは、方法論的、科学哲学的スタンスによって変わってくる。どれだけ厳密に科学的な結論を追究するのか、あるいはどれだけ柔軟性を確保して実用的に適切な結論を導こうとするのかである。これには答えがない。例えば、よくやり玉にあがる「5%水準で有意」というものも、5%というのは経験則もしくは慣例でしかないのだから、統計的な有意性でもって結論を出すことが適切なのかどうかというのも、そこに絶対的な答えはないのである。

文献

Landis, R. S., Beal, D. J., & Tesluk, P. E. (2000). A comparison of approaches to forming composite measures in structural equation models. Organizational Research Methods, 3(2), 186-207.
Rhemtulla, M. (2016). Population performance of SEM parceling strategies under measurement and structural model misspecification. Psychological Methods, 21(3), 348-368.