自動更新

並べ替え:新着順

ベストポスト
メニューを開く

#統計 p-hackingの類を完全に防ぎ、手順を尽くして仮説検定を完璧に遂行しても、P値<5%という条件によって棄却された帰無仮説達の中での実際には十分に正しいものの割合が数十%と高い値になることがある。 不正と誤用が一切なくても、P値<5%という条件単体には科学的に信頼できる結論を出す力はない。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

#統計 書籍の柳川堯『P値』にも同様の誤りがある(p.46より)。 引用【このようにしてサンプルサイズを決定しておけば,(手順(vi))で効いたと判定された場合,効果>δ₀が保証される】 テストする薬の中での効く薬の割合が5%なら、効いたと判定された薬のうち効かないものの割合が37%になる!危険!続き pic.twitter.com/PB4EYRFQ2V x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 上の方で説明したように、有意水準5%のNP流仮説検定単体には、効かない薬を購入する確率を小さくする力はない。 第1相と第2相を勝ち抜いた薬だけが第3相に到達できる制度になっているお陰で、第3相でテストされる薬の中での効く薬の割合が十分高くなっていることが本質的に重要。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 有意水準の低さが実効的な危険率(仮説検定で効くと判定された薬の中での効かない薬の割合)の低さを意味しないことは、昔から統計学入門の定番のネタの1つだと思います。 例えば『ダメな統計学』でも解説されています。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

#統計 P値<αという条件による2値的判断をするときには、帰無仮説が正しくない可能性が十分に高いかどうかを気にする必要があることについては添付画像も参照。このように私が述べていることは有名である。 添付画像は repun-app.fish.hokudai.ac.jp/pluginfile.php… アレックス・ラインハート著『ダメな統計学』 より。 pic.twitter.com/mJt9iBAjnp

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 仮にテストする薬のうち効く薬の割合が5%しかないならば、有意水準5%、検出力80%の設定でP値≤5%(有意水準2.5%の片側検定で計算)で効くと判定された薬の中での効かない薬の割合は37%になります。 この割合の高さは患者側にとっては悪夢でしょう。 jstage.jst.go.jp/article/jjb/38… 柳川堯2018 pic.twitter.com/3IMji9WvcB x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

#統計 以下のリンク先での 有意水準α=5% (両側検定、実効的にはこの半分)、検出力80%、テストする帰無仮説達の中での正しくないものの割合p の場合での 棄却された帰無仮説の中での正しい帰無仮説の割合 の計算をα=5%, 2%, 1%, 0.5%に拡張。 pic.twitter.com/yZoGcIeE2t x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 仮説検定に関わる実効的な危険率は、有意水準αと検出力1-βだけでは決まらず、事前確率γ (テストする対立仮説が正しい割合)にも大きく依存します。 疑わしい対立仮説を示したい場合には有意水準を嫌になるくらい低くする必要があるかもしれない。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 例えば、テストする薬達の中での効く薬の割合をγと書くとき、仮説検定で「効かない」という帰無仮説が棄却された薬の中での実際には効かない薬の割合(実効的な危険率)は、有意水準αを小さくすれば小さくなりますが、事前確率γを小さくなると大きくなるので、そのせめぎ合いになります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 有意水準αの仮説検定で「効く」と判定された薬の中での実際には効かない薬の割合は、検定する薬の中での本当に効く薬の割合pに依存します。 仮説検定で「効く」と判定された薬の中での実際には効かない薬の割合をαと同じ程度の大きさに抑えるためには、pを半分程度以上にする必要がある。続く x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

#統計 テストする帰無仮説達の中に正しいものと誤りのものが半々で含まれているとき、検出力1-β有意水準αの仮説検定で棄却された帰無仮説達の中での実際には正しいものの割合はα/(1+α-β)≈αになる。 つまり、正しい確率が半々の仮説を扱う場合には、有意水準αはそのまま実効的な危険率とみなせます。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 上で「実行的な危険率」は「棄却された帰無仮説達の中に含まれる実際には正しいものの割合」のことです。例えば、検定で「効く」と判定された薬達の中での実際には効かないものの割合が例になっています。これは小さくあって欲しい。 α/(1+α-β)≈αはβもαも小さければ概ね成立。どんぶり勘定。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 テストする帰無仮説達の中に正しいものと誤りのものが半々で含まれているとき、検出力1-β有意水準αの仮説検定で棄却された帰無仮説達の中での実際には正しいものの割合はα/(1+α-β)≈αになる。 つまり、正しい確率が半々の仮説を扱う場合には、有意水準αはそのまま実効的な危険率とみなせます。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

#統計 理由2: データの取得法やモデルの妥当性に問題がなくてもダメな場合がある。例えば、テストする薬の中に5%しか効く薬が含まれていない場合には、検出力80%有意水準5%の両側検定(実質有意水準2.5%の片側検定)によって「効く」と判定された薬の中での真に効く薬の割合は63%に過ぎません。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 理由2: データの取得法やモデルの妥当性に問題がなくてもダメな場合がある。例えば、テストする薬の中に5%しか効く薬が含まれていない場合には、検出力80%有意水準5%の両側検定(実質有意水準2.5%の片側検定)によって「効く」と判定された薬の中での真に効く薬の割合は63%に過ぎません。

黒木玄 Gen Kuroki@genkuroki

#統計 以下のリンク先での 有意水準α=5% (両側検定、実効的にはこの半分)、検出力80%、テストする帰無仮説達の中での正しくないものの割合p の場合での 棄却された帰無仮説の中での正しい帰無仮説の割合 の計算をα=5%, 2%, 1%, 0.5%に拡張。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 以下のリンク先での 有意水準α=5% (両側検定、実効的にはこの半分)、検出力80%、テストする帰無仮説達の中での正しくないものの割合p の場合での 棄却された帰無仮説の中での正しい帰無仮説の割合 の計算をα=5%, 2%, 1%, 0.5%に拡張。 pic.twitter.com/yZoGcIeE2t

黒木玄 Gen Kuroki@genkuroki

#統計 だから、効くと判定された薬に限定したときの効かない薬であることの条件付き確率は 0.025(1-p) / (0.8p + 0.025(1-p)). p=50%, 10%, 5%, 1%についてこの値を計算すると、それぞれ 3%、22%、37%、76% になります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 テストする薬達の中での効く薬の割合pが50%ならば、有意水準5%(両側)の「危険率」の仮説検定で「効く」と判定された薬達の中での実際には効かない薬の割合は3%と小さめの値になる。 しかし、p=10%、5%、1%ならば同割合は22%、37%、76%と大きくなり、酷いことになります。

黒木玄 Gen Kuroki@genkuroki

#統計 だから、効くと判定された薬に限定したときの効かない薬であることの条件付き確率は 0.025(1-p) / (0.8p + 0.025(1-p)). p=50%, 10%, 5%, 1%についてこの値を計算すると、それぞれ 3%、22%、37%、76% になります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 「P値<5%」という条件で「薬は効く」と判断することは、仮説検定に関わる諸々がすべて理想的になっていたとしても、テストする薬達の中で効く薬の割合が半分以上でなければ危ない、と考える必要があります。 仮説検定は理想的に使ってもそういう制限が入ります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 例えば、仮にすでに相当に吟味した薬達だけをテストするならば、テストする薬達の半分は効き目があるとしてよいでしょう。 その場合に、有意水準5%、検出力80%の両側検定のいつもの設定で、「効く」と判定された薬達の中での実際には効かない薬の割合は3%程度に抑えられます。 しかし~続く

黒木玄 Gen Kuroki@genkuroki

#統計 だから、効くと判定された薬に限定したときの効かない薬であることの条件付き確率は 0.025(1-p) / (0.8p + 0.025(1-p)). p=50%, 10%, 5%, 1%についてこの値を計算すると、それぞれ 3%、22%、37%、76% になります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 しかし現実には、Wilcoconの順位和検定(=Mann-WhitneyのU検定)は非常に安易に使われており、かなりの割合で誤用されているものと思われます。この点は過去の教育の負の遺産です。相当に酷いことになっている。 代わりに非常に頑健なBrunner-Munzel検定を使うべきです。 pic.twitter.com/soU6nP073R

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 テストする薬達の中で効く薬の割合pが半分程度以上なら仮説検定によって再現性の危機は生じない。 しかし、pが10%や5%以下になると、一切の不正がなくても、仮説検定を単純に使うと自動的に再現性の危機が発生し、効くと判定された薬の中に効かない薬が数十%の割合で含まれるようになる。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 薬の承認制度が、事前登録された研究計画の仮説検定の結果しか認めないだけではなく、多段階勝ち抜き戦になっている必要がある理由は、1段階で終わらせると、HARKingやp-hackingの類を十分に防いでも、効かない薬が承認される割合が高くなってしまうからです。(小5レベルの割合計算で分かる。)

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 条件付き確率(ベイズの定理)の説明のために、 病気かどうかを調べる検査では、検査する人たちの中に実際に病気の人が十分高い割合で含まれていないと、偽陽性率が高くなってしまうこと をよく例に使います。P値<αという条件を使う仮説検定についても同じことを言えます。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 (連続性補正無し)χ²検定との比較でFisher検定を無条件で勧めることが誤りであることについては、例えば、日本語で書かれたものには 連載 第3回 医学データの統計解析の基本 2つの割合の比較 朝倉こう子・濱﨑俊光 jstage.jst.go.jp/article/dds/30… があります。 pic.twitter.com/w2i26KsNTm

黒木玄 Gen Kuroki@genkuroki

#統計 Fisher検定は検出力の観点から常に勧めることができる検定法ではないという事実は繰り返し指摘されて来たことです。 例えば、日本語で書かれたものには 連載 第3回 医学データの統計解析の基本 2つの割合の比較 朝倉こう子・濱﨑俊光 jstage.jst.go.jp/article/dds/30… があります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 Fisher検定のP値が無駄に大きめになる傾向については jstage.jst.go.jp/article/dds/30… 連載 第3回 医学データの統計解析の基本 2つの割合の比較 朝倉こう子・濱﨑俊光 【常用的に Fisher の直接確率計算を使用することは避けた ほうがよさそうである】 を見て下さい。 pic.twitter.com/7oMzEaWQ7f

黒木玄 Gen Kuroki@genkuroki

トレンド12:16更新

  1. 1

    すぐに焼香にいくのが普通だろうが

    • ヘリ基地反対協議会
    • 死んでいる
    • 基地反対派
    • 被害者ヅラ
    • 辺野古
    • 警備員さん
    • 基地反対
    • 自責の念
  2. 2

    エンタメ

    JIMIN

    • Are You Sure?!
    • 2人旅
    • BTSの
  3. 3

    新紙幣ゲット

  4. 4

    エンタメ

    上田竜也

    • ファンクラブ会員
    • KAT-TUN上田竜也
    • DVD
    • ソロツアー
  5. 5

    ITビジネス

    日本銀行券

    • 6000億円
    • 1兆
    • 日本武尊
  6. 6

    ファッション

    契約社員

    • 使い捨て
    • 中抜き
    • 被災した
    • 20人
  7. 7

    エンタメ

    バァフアウト

    • 佐久間大介
    • BARFOUT
    • 佐久間担
  8. 8

    ITビジネス

    むち打ち刑20回

    • 禁錮17年
    • むち打ち
    • むち打ち刑
    • 禁錮17年6月
    • シンガポール
    • 性的暴行
  9. 9

    ストーカー騒動

    • SNSナンパ
    • 2年後に別れる
  10. 10

    エンタメ

    TT兄弟

    • チョコプラ
    • 有吉の壁
20位まで見る
よく使う路線を登録すると遅延情報をお知らせ Yahoo!リアルタイム検索アプリ
Yahoo!リアルタイム検索アプリ