自動更新

並べ替え:新着順

メニューを開く

#統計 仮説検定に関わる実効的な危険率は、有意水準αと検出力1-βだけでは決まらず、事前確率γ (テストする対立仮説が正しい割合)にも大きく依存します。 疑わしい対立仮説を示したい場合には有意水準を嫌になるくらい低くする必要があるかもしれない。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 例えば、テストする薬達の中での効く薬の割合をγと書くとき、仮説検定で「効かない」という帰無仮説が棄却された薬の中での実際には効かない薬の割合(実効的な危険率)は、有意水準αを小さくすれば小さくなりますが、事前確率γを小さくなると大きくなるので、そのせめぎ合いになります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 有意水準αの仮説検定で「効く」と判定された薬の中での実際には効かない薬の割合は、検定する薬の中での本当に効く薬の割合pに依存します。 仮説検定で「効く」と判定された薬の中での実際には効かない薬の割合をαと同じ程度の大きさに抑えるためには、pを半分程度以上にする必要がある。続く x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

#統計 テストする帰無仮説達の中に正しいものと誤りのものが半々で含まれているとき、検出力1-β有意水準αの仮説検定で棄却された帰無仮説達の中での実際には正しいものの割合はα/(1+α-β)≈αになる。 つまり、正しい確率が半々の仮説を扱う場合には、有意水準αはそのまま実効的な危険率とみなせます。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 上で「実行的な危険率」は「棄却された帰無仮説達の中に含まれる実際には正しいものの割合」のことです。例えば、検定で「効く」と判定された薬達の中での実際には効かないものの割合が例になっています。これは小さくあって欲しい。 α/(1+α-β)≈αはβもαも小さければ概ね成立。どんぶり勘定。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 テストする帰無仮説達の中に正しいものと誤りのものが半々で含まれているとき、検出力1-β有意水準αの仮説検定で棄却された帰無仮説達の中での実際には正しいものの割合はα/(1+α-β)≈αになる。 つまり、正しい確率が半々の仮説を扱う場合には、有意水準αはそのまま実効的な危険率とみなせます。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

#統計 理由2: データの取得法やモデルの妥当性に問題がなくてもダメな場合がある。例えば、テストする薬の中に5%しか効く薬が含まれていない場合には、検出力80%有意水準5%の両側検定(実質有意水準2.5%の片側検定)によって「効く」と判定された薬の中での真に効く薬の割合は63%に過ぎません。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 理由2: データの取得法やモデルの妥当性に問題がなくてもダメな場合がある。例えば、テストする薬の中に5%しか効く薬が含まれていない場合には、検出力80%有意水準5%の両側検定(実質有意水準2.5%の片側検定)によって「効く」と判定された薬の中での真に効く薬の割合は63%に過ぎません。

黒木玄 Gen Kuroki@genkuroki

#統計 以下のリンク先での 有意水準α=5% (両側検定、実効的にはこの半分)、検出力80%、テストする帰無仮説達の中での正しくないものの割合p の場合での 棄却された帰無仮説の中での正しい帰無仮説の割合 の計算をα=5%, 2%, 1%, 0.5%に拡張。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 以下のリンク先での 有意水準α=5% (両側検定、実効的にはこの半分)、検出力80%、テストする帰無仮説達の中での正しくないものの割合p の場合での 棄却された帰無仮説の中での正しい帰無仮説の割合 の計算をα=5%, 2%, 1%, 0.5%に拡張。 pic.twitter.com/yZoGcIeE2t

黒木玄 Gen Kuroki@genkuroki

#統計 だから、効くと判定された薬に限定したときの効かない薬であることの条件付き確率は 0.025(1-p) / (0.8p + 0.025(1-p)). p=50%, 10%, 5%, 1%についてこの値を計算すると、それぞれ 3%、22%、37%、76% になります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 テストする薬達の中での効く薬の割合pが50%ならば、有意水準5%(両側)の「危険率」の仮説検定で「効く」と判定された薬達の中での実際には効かない薬の割合は3%と小さめの値になる。 しかし、p=10%、5%、1%ならば同割合は22%、37%、76%と大きくなり、酷いことになります。

黒木玄 Gen Kuroki@genkuroki

#統計 だから、効くと判定された薬に限定したときの効かない薬であることの条件付き確率は 0.025(1-p) / (0.8p + 0.025(1-p)). p=50%, 10%, 5%, 1%についてこの値を計算すると、それぞれ 3%、22%、37%、76% になります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 「P値<5%」という条件で「薬は効く」と判断することは、仮説検定に関わる諸々がすべて理想的になっていたとしても、テストする薬達の中で効く薬の割合が半分以上でなければ危ない、と考える必要があります。 仮説検定は理想的に使ってもそういう制限が入ります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 例えば、仮にすでに相当に吟味した薬達だけをテストするならば、テストする薬達の半分は効き目があるとしてよいでしょう。 その場合に、有意水準5%、検出力80%の両側検定のいつもの設定で、「効く」と判定された薬達の中での実際には効かない薬の割合は3%程度に抑えられます。 しかし~続く

黒木玄 Gen Kuroki@genkuroki

#統計 だから、効くと判定された薬に限定したときの効かない薬であることの条件付き確率は 0.025(1-p) / (0.8p + 0.025(1-p)). p=50%, 10%, 5%, 1%についてこの値を計算すると、それぞれ 3%、22%、37%、76% になります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 しかし現実には、Wilcoconの順位和検定(=Mann-WhitneyのU検定)は非常に安易に使われており、かなりの割合で誤用されているものと思われます。この点は過去の教育の負の遺産です。相当に酷いことになっている。 代わりに非常に頑健なBrunner-Munzel検定を使うべきです。 pic.twitter.com/soU6nP073R

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 テストする薬達の中で効く薬の割合pが半分程度以上なら仮説検定によって再現性の危機は生じない。 しかし、pが10%や5%以下になると、一切の不正がなくても、仮説検定を単純に使うと自動的に再現性の危機が発生し、効くと判定された薬の中に効かない薬が数十%の割合で含まれるようになる。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 薬の承認制度が、事前登録された研究計画の仮説検定の結果しか認めないだけではなく、多段階勝ち抜き戦になっている必要がある理由は、1段階で終わらせると、HARKingやp-hackingの類を十分に防いでも、効かない薬が承認される割合が高くなってしまうからです。(小5レベルの割合計算で分かる。)

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 条件付き確率(ベイズの定理)の説明のために、 病気かどうかを調べる検査では、検査する人たちの中に実際に病気の人が十分高い割合で含まれていないと、偽陽性率が高くなってしまうこと をよく例に使います。P値<αという条件を使う仮説検定についても同じことを言えます。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 (連続性補正無し)χ²検定との比較でFisher検定を無条件で勧めることが誤りであることについては、例えば、日本語で書かれたものには 連載 第3回 医学データの統計解析の基本 2つの割合の比較 朝倉こう子・濱﨑俊光 jstage.jst.go.jp/article/dds/30… があります。 pic.twitter.com/w2i26KsNTm

黒木玄 Gen Kuroki@genkuroki

#統計 Fisher検定は検出力の観点から常に勧めることができる検定法ではないという事実は繰り返し指摘されて来たことです。 例えば、日本語で書かれたものには 連載 第3回 医学データの統計解析の基本 2つの割合の比較 朝倉こう子・濱﨑俊光 jstage.jst.go.jp/article/dds/30… があります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 Fisher検定のP値が無駄に大きめになる傾向については jstage.jst.go.jp/article/dds/30… 連載 第3回 医学データの統計解析の基本 2つの割合の比較 朝倉こう子・濱﨑俊光 【常用的に Fisher の直接確率計算を使用することは避けた ほうがよさそうである】 を見て下さい。 pic.twitter.com/7oMzEaWQ7f

黒木玄 Gen Kuroki@genkuroki

トレンド23:02更新

  1. 1

    アニメ・ゲーム

    音楽が消えた街

    • ゆめお
    • させていただいております
    • 夢追
  2. 2

    アニメ・ゲーム

    阿曇磯良

    • ひびき&千鍵
    • 担当させていただきました
    • アルターエゴ
    • ひびき
    • ドラゴンキャッスル
    • あづみのいそら
    • 神功皇后
    • イラスト
  3. 3

    二宮和也さん

  4. 4

    エンタメ

    ランキングダービー

    • それスノ
    • Snow Man
    • 嵐ちゃん
    • それ
    • 二宮和也
  5. 5

    アニメ・ゲーム

    天草四郎

    • オベロン
    • リアル脱出ゲーム
    • イラスト
    • FGO
    • 晴信
  6. 6

    スポーツ

    丸佳浩

    • サヨナラホームラン
    • 絶対的守護神
    • サヨナラ
    • 小園海斗
  7. 7

    アニメ・ゲーム

    清姫

    • ドラゴンキャッスル
  8. 8

    ニュース

    中止要請

    • 死亡事故
    • 玉城デニー知事
    • 基地反対
    • 人間のクズ
    • 人の死
    • 活動家
    • ふざけるな
    • 玉城デニー
    • 辺野古
    • 40代男性
  9. 9

    エンタメ

    楊端和

    • 山の民
    • 長澤まさみ
    • ようたんわ
    • 山の王
    • 長澤まさみちゃん
    • キングダム実写
    • 四足歩行
    • セクシーに
  10. 10

    アニメ・ゲーム

    免許不携帯

    • 審神者証
    • 時間遡行
    • 審神者
    • 防人作戦
20位まで見る

人気ポスト

よく使う路線を登録すると遅延情報をお知らせ Yahoo!リアルタイム検索アプリ
Yahoo!リアルタイム検索アプリ