すべて
画像・動画

自動更新

並べ替え：新着順

ベストポスト

#統計理由2: データの取得法やモデルの妥当性に問題がなくてもダメな場合がある。例えば、テストする薬の中に5%しか効く薬が含まれていない場合には、検出力80%有意水準5%の両側検定(実質有意水準2.5%の片側検定)によって「効く」と判定された薬の中での真に効く薬の割合は63%に過ぎません。

黒木玄 Gen Kuroki@genkuroki6月15日(土) 17:49

#統計以下のリンク先での有意水準α=5% (両側検定、実効的にはこの半分)、検出力80%、テストする帰無仮説達の中での正しくないものの割合p の場合での棄却された帰無仮説の中での正しい帰無仮説の割合の計算をα=5%, 2%, 1%, 0.5%に拡張。

黒木玄 Gen Kuroki@genkuroki

6月20日(木) 21:33

メニューを開く

#統計上で「実行的な危険率」は「棄却された帰無仮説達の中に含まれる実際には正しいものの割合」のことです。例えば、検定で「効く」と判定された薬達の中での実際には効かないものの割合が例になっています。これは小さくあって欲しい。 α/(1+α-β)≈αはβもαも小さければ概ね成立。どんぶり勘定。

黒木玄 Gen Kuroki@genkuroki

昨日 12:53

メニューを開く

#統計テストする帰無仮説達の中に正しいものと誤りのものが半々で含まれているとき、検出力1-β有意水準αの仮説検定で棄却された帰無仮説達の中での実際には正しいものの割合はα/(1+α-β)≈αになる。つまり、正しい確率が半々の仮説を扱う場合には、有意水準αはそのまま実効的な危険率とみなせます。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki6月20日(木) 21:33

#統計理由2: データの取得法やモデルの妥当性に問題がなくてもダメな場合がある。例えば、テストする薬の中に5%しか効く薬が含まれていない場合には、検出力80%有意水準5%の両側検定(実質有意水準2.5%の片側検定)によって「効く」と判定された薬の中での真に効く薬の割合は63%に過ぎません。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

昨日 12:53

メニューを開く

#統計以下のリンク先での有意水準α=5% (両側検定、実効的にはこの半分)、検出力80%、テストする帰無仮説達の中での正しくないものの割合p の場合での棄却された帰無仮説の中での正しい帰無仮説の割合の計算をα=5%, 2%, 1%, 0.5%に拡張。 pic.twitter.com/yZoGcIeE2t

黒木玄 Gen Kuroki@genkuroki6月12日(水) 22:25

#統計だから、効くと判定された薬に限定したときの効かない薬であることの条件付き確率は 0.025(1-p) / (0.8p + 0.025(1-p)). p=50%, 10%, 5%, 1%についてこの値を計算すると、それぞれ 3%、22%、37%、76% になります。続く

黒木玄 Gen Kuroki@genkuroki

6月15日(土) 17:49

メニューを開く

#統計テストする薬達の中での効く薬の割合pが50%ならば、有意水準5%(両側)の「危険率」の仮説検定で「効く」と判定された薬達の中での実際には効かない薬の割合は3%と小さめの値になる。しかし、p=10%、5%、1%ならば同割合は22%、37%、76%と大きくなり、酷いことになります。

黒木玄 Gen Kuroki@genkuroki6月12日(水) 22:25

黒木玄 Gen Kuroki@genkuroki

6月14日(金) 22:06

メニューを開く

#統計「P値<5%」という条件で「薬は効く」と判断することは、仮説検定に関わる諸々がすべて理想的になっていたとしても、テストする薬達の中で効く薬の割合が半分以上でなければ危ない、と考える必要があります。仮説検定は理想的に使ってもそういう制限が入ります。続く

黒木玄 Gen Kuroki@genkuroki

6月14日(金) 0:23

メニューを開く

#統計例えば、仮にすでに相当に吟味した薬達だけをテストするならば、テストする薬達の半分は効き目があるとしてよいでしょう。その場合に、有意水準5%、検出力80%の両側検定のいつもの設定で、「効く」と判定された薬達の中での実際には効かない薬の割合は3%程度に抑えられます。しかし～続く

黒木玄 Gen Kuroki@genkuroki6月12日(水) 22:25

黒木玄 Gen Kuroki@genkuroki

6月14日(金) 0:23

メニューを開く

#統計しかし現実には、Wilcoconの順位和検定(=Mann-WhitneyのU検定)は非常に安易に使われており、かなりの割合で誤用されているものと思われます。この点は過去の教育の負の遺産です。相当に酷いことになっている。代わりに非常に頑健なBrunner-Munzel検定を使うべきです。 pic.twitter.com/soU6nP073R

黒木玄 Gen Kuroki@genkuroki

6月14日(金) 0:23

メニューを開く

#統計テストする薬達の中で効く薬の割合pが半分程度以上なら仮説検定によって再現性の危機は生じない。しかし、pが10%や5%以下になると、一切の不正がなくても、仮説検定を単純に使うと自動的に再現性の危機が発生し、効くと判定された薬の中に効かない薬が数十%の割合で含まれるようになる。

黒木玄 Gen Kuroki@genkuroki

6月12日(水) 22:25

メニューを開く

#統計薬の承認制度が、事前登録された研究計画の仮説検定の結果しか認めないだけではなく、多段階勝ち抜き戦になっている必要がある理由は、1段階で終わらせると、HARKingやp-hackingの類を十分に防いでも、効かない薬が承認される割合が高くなってしまうからです。(小5レベルの割合計算で分かる。)

黒木玄 Gen Kuroki@genkuroki

6月10日(月) 15:07

メニューを開く

#統計条件付き確率(ベイズの定理)の説明のために、病気かどうかを調べる検査では、検査する人たちの中に実際に病気の人が十分高い割合で含まれていないと、偽陽性率が高くなってしまうことをよく例に使います。P値<αという条件を使う仮説検定についても同じことを言えます。

黒木玄 Gen Kuroki@genkuroki

6月7日(金) 23:44

メニューを開く

#統計 (連続性補正無し)χ²検定との比較でFisher検定を無条件で勧めることが誤りであることについては、例えば、日本語で書かれたものには連載第3回医学データの統計解析の基本 2つの割合の比較朝倉こう子・濱﨑俊光 jstage.jst.go.jp/article/dds/30… があります。 pic.twitter.com/w2i26KsNTm

黒木玄 Gen Kuroki@genkuroki2023年10月20日

#統計 Fisher検定は検出力の観点から常に勧めることができる検定法ではないという事実は繰り返し指摘されて来たことです。例えば、日本語で書かれたものには連載第3回医学データの統計解析の基本 2つの割合の比較朝倉こう子・濱﨑俊光 jstage.jst.go.jp/article/dds/30… があります。

黒木玄 Gen Kuroki@genkuroki

2023年11月16日

メニューを開く

#統計 Fisher検定のP値が無駄に大きめになる傾向については jstage.jst.go.jp/article/dds/30… 連載第3回医学データの統計解析の基本 2つの割合の比較朝倉こう子・濱﨑俊光【常用的に Fisher の直接確率計算を使用することは避けたほうがよさそうである】を見て下さい。 pic.twitter.com/7oMzEaWQ7f