「統計学の推定には、点推定と区間推定があるけど、何が違うの?」
「どうやって使い分けるの?」
本記事では、上記のような悩みに対して答えていきます。
【図でイメージ】点推定と区間推定の違い
- 点推定…ピンポイントで推定する
- 区間推定…推定値は真の値からずれていると考えて、幅を持って推定する
日本語から想像される意味と同じですので、直感的で分かりやすいです。
下記のようなイメージを持つと理解しやすいです。
そもそも、なぜ推定を行うのでしょうか?
推定を行う目的は「真の値が分からない」からです。
例えば、鉛筆の長さを測るという単純な問題でさえ、繰り返し測定すると、
8.54, 8.57, 8.55, 8.60, 8.53 (cm)
というように、毎回同じ値が得られるわけではありません。
そこで、
「8.54 cm が得られる確率は〇%」
「8.57 cm が得られる確率は〇%」
という集団を仮定して、その集団からデータを抜き取ったと考えます。(下図)
私たちが求めたいのは、真の平均値ですが、真の平均値は誰にも分からないので、得られたデータの平均値で代用するのです。(下図)
当然、データの平均値が真の平均値と一致している保証はありませんから、点推定や区間推定で「真の平均値」を予測します。
点推定と区間推定の使い分け
「結局、点推定と区間推定はどっちを使えばいいの?」
と疑問に思われる方もいるかもしれません。
明確に決まっているわけではありませんが、以下のように使い分けると良いです。
- 点推定…集団全体がどのような分布になるか全く分からないとき
- 区間推定…集団全体の分布が理論的・経験的に予測できるとき
理由は、点推定と区間推定には表に示すメリット・デメリットがあるからです。
メリット | デメリット | |
---|---|---|
点推定 | 得られたデータだけから計算可能 | 真の値からの離れ具合が分からない |
区間推定 | データから計算された値の信頼性が分かる | 集団全体の分布を仮定する必要がある |
例えば、
「最近、製造機械の調子が悪くて完成品 5 個を抜き取って検査した」
という場合には、データがどのような分布に従うのか分かりませんから、点推定を用いる方が確実です。
反対に、
「稼働中の機械の性能を確かめるために、完成品を 100 個抜き取って検査した」
という場合には、機械の性能が安定しており、検査した数も多いので正規分布に従うと仮定しても高い精度で推定できます。
まとめると、
点推定は分布に依存せずに推定できるのが利点であり、区間推定は推定値の信頼性が分かるのが利点です。
まとめ
本記事では、点推定と区間推定の違いと使い分けを紹介しました。
点推定と区間推定には、それぞれ下記のようなポイントがあります。
- 点推定…ピンポイントで推定する。分布に依存しない。
- 区間推定…幅を持って推定する。信頼性が高い。
違いをしっかりと理解して使いこなしましょう。