モデルとは何か、統計モデルとは何か

研究の世界では、理論やモデルが登場するが、この中の「モデル」とはいったいなにか。これについて、馬場(2015)は次のように説明する。そもそも、世界は複雑である。そこで、この複雑な世界を人間が理解できるようにするには、単純化することが必要になる。これがモデル化である。モデル化ができれば、現象に対する理解が深まるだけでなく、シミュレーションを通して、将来予測もできる。


つまり、馬場によれば、モデルとは、単純化された世界のことである。何も考えずに単純化してしまえば、本物とかけはなれたものになってしまうので、データを用いてなるべく客観的にモデルを作ろうとする。統計データから作られるモデルを、統計モデルと呼ぶ。統計データをデータのまま見ていても理解は深まらない。であるから、統計モデルは、データを理解しやすい構造にしたものであるといえる。言い換えれば、データを構造化して、人間が理解しやすいようにすること、この作業を通して、世界を単純化して取り扱うこと、これがモデル化である。


複雑な世界を人間が理解できるように単純化することがモデル化であるから、モデルは単純なほうが良い。つまり、複雑なモデルはモデル化の目指すべき方向ではない。もちろん、現実の世界で見られる現象は、さまざまな要因が複雑に絡み合って生じている。しかし、そういった要因をすべて考慮することは現実的ではない。そこで、統計モデルを使って、人間が理解できるくらい簡単な構造で、現実に合うくらいの複雑さを伴った、この世界を表す構造を探るのである。


このために、「誤差」を含めたモデルを作る。データを構造化し、人間が理解しやすいようにモデル化する際に、注目している要素に着目したならば、それ以外の数多くの要因、本来はもっとややこしい構造、考えだすときりがないような細かい部分を「誤差」としてまとめてしまうのである。そうすることで、統計モデルは、注目している構造だけにスコープを当てることができ、複雑な世界を単純化して取り扱うことができるようになるのである。