信頼区間と確信区間はどう違うのか

統計学では、母集団からサンプルを採取し、そのサンプルの情報から、ある値を推定する。その際、推定した値の信頼区間(confidence interval)や確信区間(credibility interval)を構築する。信頼区間と確信区間は、紛らわしいが似て非なるものである。豊田(2016)でも解説しているように、信頼区間は伝統的な統計学の考えに基づいたものであるがややこしく、確信区間ベイズ統計の考えに基づいたもので直感的に分かりやすいがまだ普及していないといえる。


例えば「95%信頼区間」とはどういう意味かというと、「サンプルを取り直して新たに信頼区間を作ることを1000回繰り返したとすると、そのうち950回は真の値(推測する対象となる母集団の値)を含んでいる」ということである。これが95%の意味である。伝統的な統計学の考えでは、推測の対象となる母集団の真の値は1つしかない。だから、この値は分からないが動かない。動くのは、推測値で、サンプルを取り直すたびに値が変わる。いまのサンプルの情報から得られる推測値が母集団の真の値をいちばん的確に推測しているはずではあるが、サンプルを取り直すと推測値は違う値になるはずである。だから、推測値はたまたま今のサンプルだとその値だが、その値が母集団の真の値とドンピシャで一致するわけではない。よって、信頼区間という幅を持たせることで、その信頼区間が固定された真の値を含む確率を高めようとするわけである。直観的にはなんとなく分かるが、95%の意味が実は分かりにくいのである。


一方「95%確信区間」はもっとシンプルかつ直感的な意味を持っており、「その区間の中に推測する対象となる母集団の値が入っている確率が95%である」ということである。確信区間のほうが直感的で分かりやすい。しかし、伝統的な統計学からみて容認しがたい問題なのは、真の値が1つしかないはずの推測する対象となる母集団の値が確率的に変動すると考えていることである。これは理想論からするとおかしい。しかし、真の値が1つしかなくても、それを確率の問題として考えるほうが人間の思考にあっているのである。例えば、好きな相手が自分を好きか嫌いかの2通りしかないとすると、ある時点でどちらかであるかはすでに決定しており固定している。しかし、そうであるにも関わらず、何らかの反応を見て(サンプルに相当する)、相手が私のことを好きな確率はどれくらいだろうかと考える。


ベイズ統計は上記のような発想を前提にした統計学であるから、採取したサンプルからある推測値および確信区間が得られたときに、その中に、推測すべき母集団の値が入っている確率はどれくらいなのだろうかと考えるのは自然なのである。もちろん、ベイズ統計においても、サンプルを取り直せば、推測値は変わってくる。しかし、推測値が変われば、その情報を、推測する対象となる母集団の値の確率分布の修正に利用していくという考え方を持っているのである。例えば先の例で、初めてデータに誘ったときに相手が応じてくれた場合、もしかしたら好きではないが義理で応じてくれたのかもしれない、つまり、相手が自分のことを好きな確率はそれほど高くはないと思うかもしれないが、次に誘った時も2回連続で相手が応じてくれた場合に、1回目に応じてくれたときの考え方を改め、相手が自分のことを好きな確率はかなり高いだろうという考えに至るのと同じである。