- すべて
- 画像・動画
並べ替え:新着順
#統計 p-hackingの類を完全に防ぎ、手順を尽くして仮説検定を完璧に遂行しても、P値<5%という条件によって棄却された帰無仮説達の中での実際には十分に正しいものの割合が数十%と高い値になることがある。 不正と誤用が一切なくても、P値<5%という条件単体には科学的に信頼できる結論を出す力はない。 x.com/genkuroki/stat…
#統計 書籍の柳川堯『P値』にも同様の誤りがある(p.46より)。 引用【このようにしてサンプルサイズを決定しておけば,(手順(vi))で効いたと判定された場合,効果>δ₀が保証される】 テストする薬の中での効く薬の割合が5%なら、効いたと判定された薬のうち効かないものの割合が37%になる!危険!続き pic.twitter.com/PB4EYRFQ2V x.com/genkuroki/stat…
#統計 有意水準の低さが実効的な危険率(仮説検定で効くと判定された薬の中での効かない薬の割合)の低さを意味しないことは、昔から統計学入門の定番のネタの1つだと思います。 例えば『ダメな統計学』でも解説されています。 x.com/genkuroki/stat…
#統計 P値<αという条件による2値的判断をするときには、帰無仮説が正しくない可能性が十分に高いかどうかを気にする必要があることについては添付画像も参照。このように私が述べていることは有名である。 添付画像は repun-app.fish.hokudai.ac.jp/pluginfile.php… アレックス・ラインハート著『ダメな統計学』 より。 pic.twitter.com/mJt9iBAjnp
#統計 有意水準αの仮説検定で「効く」と判定された薬の中での実際には効かない薬の割合は、検定する薬の中での本当に効く薬の割合pに依存します。 仮説検定で「効く」と判定された薬の中での実際には効かない薬の割合をαと同じ程度の大きさに抑えるためには、pを半分程度以上にする必要がある。続く x.com/genkuroki/stat…
#統計 テストする帰無仮説達の中に正しいものと誤りのものが半々で含まれているとき、検出力1-β有意水準αの仮説検定で棄却された帰無仮説達の中での実際には正しいものの割合はα/(1+α-β)≈αになる。 つまり、正しい確率が半々の仮説を扱う場合には、有意水準αはそのまま実効的な危険率とみなせます。 x.com/genkuroki/stat…
「○によって変わるから答えようがない」となるよね 「P値」や「P値に基づく仮説検定」も同様:「(事前分布)x 観測値 = 解釈できる確率(頻度・割合)」なので、事前分布が不明な場合は「P値」も「仮説検定」も解釈不能。RCT はある程度は解釈可能だが、観察研究は無理 x.com/ueafam/status/…
#統計 テストする帰無仮説達の中に正しいものと誤りのものが半々で含まれているとき、検出力1-β有意水準αの仮説検定で棄却された帰無仮説達の中での実際には正しいものの割合はα/(1+α-β)≈αになる。 つまり、正しい確率が半々の仮説を扱う場合には、有意水準αはそのまま実効的な危険率とみなせます。 x.com/genkuroki/stat…
#統計 理由2: データの取得法やモデルの妥当性に問題がなくてもダメな場合がある。例えば、テストする薬の中に5%しか効く薬が含まれていない場合には、検出力80%有意水準5%の両側検定(実質有意水準2.5%の片側検定)によって「効く」と判定された薬の中での真に効く薬の割合は63%に過ぎません。 x.com/genkuroki/stat…