自動更新

並べ替え：新着順

#統計 p-hackingの類を完全に防ぎ、手順を尽くして仮説検定を完璧に遂行しても、P値<5%という条件によって棄却された帰無仮説達の中での実際には十分に正しいものの割合が数十%と高い値になることがある。不正と誤用が一切なくても、P値<5%という条件単体には科学的に信頼できる結論を出す力はない。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki6月29日(土) 20:51

#統計書籍の柳川堯『P値』にも同様の誤りがある(p.46より)。引用【このようにしてサンプルサイズを決定しておけば，(手順(vi))で効いたと判定された場合，効果>δ₀が保証される】テストする薬の中での効く薬の割合が5%なら、効いたと判定された薬のうち効かないものの割合が37%になる！危険！続き pic.twitter.com/PB4EYRFQ2V x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

7月2日(火) 9:31

メニューを開く

#統計上の方で説明したように、有意水準5%のNP流仮説検定単体には、効かない薬を購入する確率を小さくする力はない。第1相と第2相を勝ち抜いた薬だけが第3相に到達できる制度になっているお陰で、第3相でテストされる薬の中での効く薬の割合が十分高くなっていることが本質的に重要。

黒木玄 Gen Kuroki@genkuroki

6月29日(土) 9:41

メニューを開く

#統計有意水準の低さが実効的な危険率(仮説検定で効くと判定された薬の中での効かない薬の割合)の低さを意味しないことは、昔から統計学入門の定番のネタの1つだと思います。例えば『ダメな統計学』でも解説されています。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki2024年6月8日

#統計 P値<αという条件による2値的判断をするときには、帰無仮説が正しくない可能性が十分に高いかどうかを気にする必要があることについては添付画像も参照。このように私が述べていることは有名である。添付画像は repun-app.fish.hokudai.ac.jp/pluginfile.php… アレックス・ラインハート著『ダメな統計学』より。 pic.twitter.com/mJt9iBAjnp

黒木玄 Gen Kuroki@genkuroki

6月28日(金) 23:52

メニューを開く

#統計 仮説検定に関わる実効的な危険率は、有意水準αと検出力1-βだけでは決まらず、事前確率γ (テストする対立仮説が正しい割合)にも大きく依存します。疑わしい対立仮説を示したい場合には有意水準を嫌になるくらい低くする必要があるかもしれない。

黒木玄 Gen Kuroki@genkuroki

6月26日(水) 17:13

メニューを開く

#統計例えば、テストする薬達の中での効く薬の割合をγと書くとき、仮説検定で「効かない」という帰無仮説が棄却された薬の中での実際には効かない薬の割合(実効的な危険率)は、有意水準αを小さくすれば小さくなりますが、事前確率γを小さくなると大きくなるので、そのせめぎ合いになります。

黒木玄 Gen Kuroki@genkuroki

6月26日(水) 17:08

メニューを開く

#統計有意水準αの仮説検定で「効く」と判定された薬の中での実際には効かない薬の割合は、検定する薬の中での本当に効く薬の割合pに依存します。 仮説検定で「効く」と判定された薬の中での実際には効かない薬の割合をαと同じ程度の大きさに抑えるためには、pを半分程度以上にする必要がある。続く x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki6月21日(金) 12:53

#統計テストする帰無仮説達の中に正しいものと誤りのものが半々で含まれているとき、検出力1-β有意水準αの仮説検定で棄却された帰無仮説達の中での実際には正しいものの割合はα/(1+α-β)≈αになる。つまり、正しい確率が半々の仮説を扱う場合には、有意水準αはそのまま実効的な危険率とみなせます。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

6月24日(月) 14:12

メニューを開く

「○によって変わるから答えようがない」となるよね「Ｐ値」や「Ｐ値に基づく仮説検定」も同様：「（事前分布）x 観測値 = 解釈できる確率（頻度・割合）」なので、事前分布が不明な場合は「Ｐ値」も「仮説検定」も解釈不能。RCT はある程度は解釈可能だが、観察研究は無理 x.com/ueafam/status/…

Illusion of Evidence (IoE)@ueafam6月23日(日) 8:01

Ｑ．掛け算の結果を大きい順に並べ替えよ。Ａ．○ x 3 = ? Ｂ．○ x 5 = ? Ｃ．○ x 7 = ?

Illusion of Evidence (IoE)@ueafam

6月23日(日) 8:04

メニューを開く

#統計テストする帰無仮説達の中に正しいものと誤りのものが半々で含まれているとき、検出力1-β有意水準αの仮説検定で棄却された帰無仮説達の中での実際には正しいものの割合はα/(1+α-β)≈αになる。つまり、正しい確率が半々の仮説を扱う場合には、有意水準αはそのまま実効的な危険率とみなせます。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki6月20日(木) 21:33

#統計理由2: データの取得法やモデルの妥当性に問題がなくてもダメな場合がある。例えば、テストする薬の中に5%しか効く薬が含まれていない場合には、検出力80%有意水準5%の両側検定(実質有意水準2.5%の片側検定)によって「効く」と判定された薬の中での真に効く薬の割合は63%に過ぎません。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

6月21日(金) 12:53

メニューを開く

#統計テストする薬達の中での効く薬の割合pが50%ならば、有意水準5%(両側)の「危険率」の仮説検定で「効く」と判定された薬達の中での実際には効かない薬の割合は3%と小さめの値になる。しかし、p=10%、5%、1%ならば同割合は22%、37%、76%と大きくなり、酷いことになります。

黒木玄 Gen Kuroki@genkuroki2024年6月12日