| 統計検定↓↓↓ | 「有意差がある」ことを検証すること。 |
対立仮説 alternative hypothesis | 検定をする人が、望んでいる仮説。---「2群に差がある。」 ↓しかし統計的手法は、は、ひねくれている! | |
帰無仮説 null hypothesis | 検定を行うときに立てる仮説。 ---「2群に差がある」と予想されるのに、わざわざ可能性の少ない「2群に差がない」と無に帰する仮説! |
| 検定 | =統計学的帰無仮説検定 帰無仮説を立て、得られたデータから、帰無仮説が成り立つかどうかを検証すること。 |
p値 Probability | 測定したデータが、偶然帰無仮説通りになる確率=対立仮説通りにならない危険率!
2群に、たまたま差が出ないことは、ありえないわけではない。そのまれなことが起きる確率。 |
| 有意水準 | 帰無仮説を棄却するために、あらかじめ決めた確率水準。 5%、あるいは1%と決めることが多い。 |
統計学的 有意差あり statistical significance | p値 <有意水準 ---「差がない確率」は有意水準以下である!--帰無仮説は棄却→→→
1. 帰無仮説が棄却されたので、「有意差あり!」
2. 「有意差がない」にもかかわらず、たまたま珍しい事象が観察され、検定では「有意差あり!」となった。
あくまで統計は確立であり、「有意差あり」は「データの重要性」を保証するものではない。 |
統計学的 有意差なし | p値 >有意水準 ---「差がない確率」が高い。--帰無仮説は承認→→→
1. 帰無仮説が承認されたので、「有意差が認められない!」=「等しい」というわけではない!
→まずは、データを増やして再検討!
→考察例)「統計学的に有意差は認められなかったが、一定の傾向が示唆された。」
→考察例)「有意差を検出するために十分なサンプル数で検定したので、意味のある差はないと判断した。」
2. 「有意差がある」にもかかわらず、たまたま珍しい事象が観察され、検定では「有意差なし!」となった。 |
検定における 2つの誤り | 第1種の過誤type-I error level: 「帰無仮説が正しい場合に,誤って仮説を棄却する誤り」の判断の基準となる確率。
---「有意差がない」のに、「有意差がある」とする誤り
第2種の過誤t type II error (β): 「帰無仮説が誤っているのに,仮説を採択してしまう誤り」
---「有意差がある」のに、「有意差がない」とする誤り
|
| サンプル数 | サンプル数が大きい場合は、小さい差であっても「統計学的有意」となる場合がある。
「実験における重要性」を検出できるような研究デザインを組むことも重要である。 |
外れ値
Outlier | データの主要な固まりから大きく外れたデータ。
ミスである可能性もあるので、解析の前に外れ値のチェックを行うことは極めて重要である。
(明らかな原因がなく極端なデータが生じた場合は、スルミノフ棄却検定やトンプソン棄却検定により判定する必要があるらしい。)
がある |
両側検定と 片側検定 |
帰無仮説に方向性がある場合のみ、片側検定を使う。
ex)仮説「新薬は旧薬より効くはずである。」
両側検定におけるP値0.05は、片側0.025になるが、片側検定では片側のみで0.05なので、当然片側検定の方が有意差が出やすくなる。 |
| 自由度 |
サンプルの大きさによって、ズレの確率は違ってくる。したがって、統計的検定ではサンプルの大きさを表す「自由度」という基準を算出し、それに対応したズレの確率を推定する。
t検定 ----サンプル総数マイナス1
対応のある平均値の差の検定 ----対の数マイナス1 |