自動更新

並べ替え:新着順

ベストポスト
メニューを開く

#統計 理由2: データの取得法やモデルの妥当性に問題がなくてもダメな場合がある。例えば、テストする薬の中に5%しか効く薬が含まれていない場合には、検出力80%有意水準5%の両側検定(実質有意水準2.5%の片側検定)によって「効く」と判定された薬の中での真に効く薬の割合は63%に過ぎません。

黒木玄 Gen Kuroki@genkuroki

#統計 以下のリンク先での 有意水準α=5% (両側検定、実効的にはこの半分)、検出力80%、テストする帰無仮説達の中での正しくないものの割合p の場合での 棄却された帰無仮説の中での正しい帰無仮説の割合 の計算をα=5%, 2%, 1%, 0.5%に拡張。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 上で「実行的な危険率」は「棄却された帰無仮説達の中に含まれる実際には正しいものの割合」のことです。例えば、検定で「効く」と判定された薬達の中での実際には効かないものの割合が例になっています。これは小さくあって欲しい。 α/(1+α-β)≈αはβもαも小さければ概ね成立。どんぶり勘定。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 テストする帰無仮説達の中に正しいものと誤りのものが半々で含まれているとき、検出力1-β有意水準αの仮説検定で棄却された帰無仮説達の中での実際には正しいものの割合はα/(1+α-β)≈αになる。 つまり、正しい確率が半々の仮説を扱う場合には、有意水準αはそのまま実効的な危険率とみなせます。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

#統計 理由2: データの取得法やモデルの妥当性に問題がなくてもダメな場合がある。例えば、テストする薬の中に5%しか効く薬が含まれていない場合には、検出力80%有意水準5%の両側検定(実質有意水準2.5%の片側検定)によって「効く」と判定された薬の中での真に効く薬の割合は63%に過ぎません。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 以下のリンク先での 有意水準α=5% (両側検定、実効的にはこの半分)、検出力80%、テストする帰無仮説達の中での正しくないものの割合p の場合での 棄却された帰無仮説の中での正しい帰無仮説の割合 の計算をα=5%, 2%, 1%, 0.5%に拡張。 pic.twitter.com/yZoGcIeE2t

黒木玄 Gen Kuroki@genkuroki

#統計 だから、効くと判定された薬に限定したときの効かない薬であることの条件付き確率は 0.025(1-p) / (0.8p + 0.025(1-p)). p=50%, 10%, 5%, 1%についてこの値を計算すると、それぞれ 3%、22%、37%、76% になります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 テストする薬達の中での効く薬の割合pが50%ならば、有意水準5%(両側)の「危険率」の仮説検定で「効く」と判定された薬達の中での実際には効かない薬の割合は3%と小さめの値になる。 しかし、p=10%、5%、1%ならば同割合は22%、37%、76%と大きくなり、酷いことになります。

黒木玄 Gen Kuroki@genkuroki

#統計 だから、効くと判定された薬に限定したときの効かない薬であることの条件付き確率は 0.025(1-p) / (0.8p + 0.025(1-p)). p=50%, 10%, 5%, 1%についてこの値を計算すると、それぞれ 3%、22%、37%、76% になります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 「P値<5%」という条件で「薬は効く」と判断することは、仮説検定に関わる諸々がすべて理想的になっていたとしても、テストする薬達の中で効く薬の割合が半分以上でなければ危ない、と考える必要があります。 仮説検定は理想的に使ってもそういう制限が入ります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 例えば、仮にすでに相当に吟味した薬達だけをテストするならば、テストする薬達の半分は効き目があるとしてよいでしょう。 その場合に、有意水準5%、検出力80%の両側検定のいつもの設定で、「効く」と判定された薬達の中での実際には効かない薬の割合は3%程度に抑えられます。 しかし~続く

黒木玄 Gen Kuroki@genkuroki

#統計 だから、効くと判定された薬に限定したときの効かない薬であることの条件付き確率は 0.025(1-p) / (0.8p + 0.025(1-p)). p=50%, 10%, 5%, 1%についてこの値を計算すると、それぞれ 3%、22%、37%、76% になります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 しかし現実には、Wilcoconの順位和検定(=Mann-WhitneyのU検定)は非常に安易に使われており、かなりの割合で誤用されているものと思われます。この点は過去の教育の負の遺産です。相当に酷いことになっている。 代わりに非常に頑健なBrunner-Munzel検定を使うべきです。 pic.twitter.com/soU6nP073R

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 テストする薬達の中で効く薬の割合pが半分程度以上なら仮説検定によって再現性の危機は生じない。 しかし、pが10%や5%以下になると、一切の不正がなくても、仮説検定を単純に使うと自動的に再現性の危機が発生し、効くと判定された薬の中に効かない薬が数十%の割合で含まれるようになる。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 薬の承認制度が、事前登録された研究計画の仮説検定の結果しか認めないだけではなく、多段階勝ち抜き戦になっている必要がある理由は、1段階で終わらせると、HARKingやp-hackingの類を十分に防いでも、効かない薬が承認される割合が高くなってしまうからです。(小5レベルの割合計算で分かる。)

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 条件付き確率(ベイズの定理)の説明のために、 病気かどうかを調べる検査では、検査する人たちの中に実際に病気の人が十分高い割合で含まれていないと、偽陽性率が高くなってしまうこと をよく例に使います。P値<αという条件を使う仮説検定についても同じことを言えます。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 (連続性補正無し)χ²検定との比較でFisher検定を無条件で勧めることが誤りであることについては、例えば、日本語で書かれたものには 連載 第3回 医学データの統計解析の基本 2つの割合の比較 朝倉こう子・濱﨑俊光 jstage.jst.go.jp/article/dds/30… があります。 pic.twitter.com/w2i26KsNTm

黒木玄 Gen Kuroki@genkuroki

#統計 Fisher検定は検出力の観点から常に勧めることができる検定法ではないという事実は繰り返し指摘されて来たことです。 例えば、日本語で書かれたものには 連載 第3回 医学データの統計解析の基本 2つの割合の比較 朝倉こう子・濱﨑俊光 jstage.jst.go.jp/article/dds/30… があります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 Fisher検定のP値が無駄に大きめになる傾向については jstage.jst.go.jp/article/dds/30… 連載 第3回 医学データの統計解析の基本 2つの割合の比較 朝倉こう子・濱﨑俊光 【常用的に Fisher の直接確率計算を使用することは避けた ほうがよさそうである】 を見て下さい。 pic.twitter.com/7oMzEaWQ7f

黒木玄 Gen Kuroki@genkuroki

トレンド2:46更新

  1. 1

    ファッション

    ミハラヤスヒロ

    • 関口メンディー
    • ラウール
    • パリコレ
    • BananasModels
  2. 2

    エンタメ

    真夜中のゲーム大会

    • ニブケン
    • 丹生明里
    • 上村ひなの
    • ストリートファイター6
    • ストリートファイター
  3. 3

    エンタメ

    レナセールセレナーデ

    • ももクロ
    • 4人
  4. 4

    グローバル展開

    • カバー株式会社
    • グローバル
  5. 5

    アニメ・ゲーム

    八雲なみ

    • ジムシャニ
    • 朝焼けは黄金色
    • なみちゃん
    • にちか
  6. 6

    アニメ・ゲーム

    Fate/Zero

    • Fate/stay night
    • BS11
    • zero
    • 再放送
  7. 7

    エンタメ

    まさか偶然

    • まさか 偶然...
    • ゆばレタ
  8. 8

    ITビジネス

    モデル事務所

    • ラウ担
    • BANANAS MODELS
    • BANANAS
    • 事務所と契約
  9. 9

    エンタメ

    ひらがなけやき

    • おいシャン
    • 永遠の白線
    • おいでシャンプー
    • めみたん
    • めみ
  10. 10

    スポーツ

    レヴァンドフスキ

    • ピョンテク
    • レバンドフスキ
    • ポーランド代表
    • オーストリア
    • ポーランド
    • ユーロ2024
20位まで見る

人気ポスト

電車遅延(在来線、私鉄、地下鉄)

遅延している路線はありません

全国の運行情報(Yahoo!路線情報)
よく使う路線を登録すると遅延情報をお知らせ Yahoo!リアルタイム検索アプリ
Yahoo!リアルタイム検索アプリ