自動更新

並べ替え:新着順

メニューを開く

#統計 p-hackingの類を完全に防ぎ、手順を尽くして仮説検定を完璧に遂行しても、P値<5%という条件によって棄却された帰無仮説達の中での実際には十分に正しいものの割合が数十%と高い値になることがある。 不正と誤用が一切なくても、P値<5%という条件単体には科学的に信頼できる結論を出す力はない。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

#統計 書籍の柳川堯『P値』にも同様の誤りがある(p.46より)。 引用【このようにしてサンプルサイズを決定しておけば,(手順(vi))で効いたと判定された場合,効果>δ₀が保証される】 テストする薬の中での効く薬の割合が5%なら、効いたと判定された薬のうち効かないものの割合が37%になる!危険!続き pic.twitter.com/PB4EYRFQ2V x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 上の方で説明したように、有意水準5%のNP流仮説検定単体には、効かない薬を購入する確率を小さくする力はない。 第1相と第2相を勝ち抜いた薬だけが第3相に到達できる制度になっているお陰で、第3相でテストされる薬の中での効く薬の割合が十分高くなっていることが本質的に重要。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 有意水準の低さが実効的な危険率(仮説検定で効くと判定された薬の中での効かない薬の割合)の低さを意味しないことは、昔から統計学入門の定番のネタの1つだと思います。 例えば『ダメな統計学』でも解説されています。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

#統計 P値<αという条件による2値的判断をするときには、帰無仮説が正しくない可能性が十分に高いかどうかを気にする必要があることについては添付画像も参照。このように私が述べていることは有名である。 添付画像は repun-app.fish.hokudai.ac.jp/pluginfile.php… アレックス・ラインハート著『ダメな統計学』 より。 pic.twitter.com/mJt9iBAjnp

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 仮説検定に関わる実効的な危険率は、有意水準αと検出力1-βだけでは決まらず、事前確率γ (テストする対立仮説が正しい割合)にも大きく依存します。 疑わしい対立仮説を示したい場合には有意水準を嫌になるくらい低くする必要があるかもしれない。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 例えば、テストする薬達の中での効く薬の割合をγと書くとき、仮説検定で「効かない」という帰無仮説が棄却された薬の中での実際には効かない薬の割合(実効的な危険率)は、有意水準αを小さくすれば小さくなりますが、事前確率γを小さくなると大きくなるので、そのせめぎ合いになります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 有意水準αの仮説検定で「効く」と判定された薬の中での実際には効かない薬の割合は、検定する薬の中での本当に効く薬の割合pに依存します。 仮説検定で「効く」と判定された薬の中での実際には効かない薬の割合をαと同じ程度の大きさに抑えるためには、pを半分程度以上にする必要がある。続く x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

#統計 テストする帰無仮説達の中に正しいものと誤りのものが半々で含まれているとき、検出力1-β有意水準αの仮説検定で棄却された帰無仮説達の中での実際には正しいものの割合はα/(1+α-β)≈αになる。 つまり、正しい確率が半々の仮説を扱う場合には、有意水準αはそのまま実効的な危険率とみなせます。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

「○によって変わるから答えようがない」となるよね 「P値」や「P値に基づく仮説検定」も同様:「(事前分布)x 観測値 = 解釈できる確率(頻度・割合)」なので、事前分布が不明な場合は「P値」も「仮説検定」も解釈不能。RCT はある程度は解釈可能だが、観察研究は無理 x.com/ueafam/status/…

Illusion of Evidence (IoE)@ueafam

Q.掛け算の結果を大きい順に並べ替えよ。 A.○ x 3 = ? B.○ x 5 = ? C.○ x 7 = ?

Illusion of Evidence (IoE)@ueafam

メニューを開く

#統計 テストする帰無仮説達の中に正しいものと誤りのものが半々で含まれているとき、検出力1-β有意水準αの仮説検定で棄却された帰無仮説達の中での実際には正しいものの割合はα/(1+α-β)≈αになる。 つまり、正しい確率が半々の仮説を扱う場合には、有意水準αはそのまま実効的な危険率とみなせます。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

#統計 理由2: データの取得法やモデルの妥当性に問題がなくてもダメな場合がある。例えば、テストする薬の中に5%しか効く薬が含まれていない場合には、検出力80%有意水準5%の両側検定(実質有意水準2.5%の片側検定)によって「効く」と判定された薬の中での真に効く薬の割合は63%に過ぎません。 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

χ二乗検定…仮説検定に使う手法のひとつ、期待値からのズレの大きさから、集めたデータが帰無仮説に従うか、あるいは異なるかを検定する手法。 帰無仮説…対象もう1つのものと差がない、という仮説。この場合、イカサマサイコロは普通のサイコロと同じような割合で目が出るという仮説。…

ひまじん( ・∇・)@ES_himazin

メニューを開く

#統計 テストする薬達の中での効く薬の割合pが50%ならば、有意水準5%(両側)の「危険率」の仮説検定で「効く」と判定された薬達の中での実際には効かない薬の割合は3%と小さめの値になる。 しかし、p=10%、5%、1%ならば同割合は22%、37%、76%と大きくなり、酷いことになります。

黒木玄 Gen Kuroki@genkuroki

#統計 だから、効くと判定された薬に限定したときの効かない薬であることの条件付き確率は 0.025(1-p) / (0.8p + 0.025(1-p)). p=50%, 10%, 5%, 1%についてこの値を計算すると、それぞれ 3%、22%、37%、76% になります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 「P値<5%」という条件で「薬は効く」と判断することは、仮説検定に関わる諸々がすべて理想的になっていたとしても、テストする薬達の中で効く薬の割合が半分以上でなければ危ない、と考える必要があります。 仮説検定は理想的に使ってもそういう制限が入ります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 テストする薬達の中で効く薬の割合pが半分程度以上なら仮説検定によって再現性の危機は生じない。 しかし、pが10%や5%以下になると、一切の不正がなくても、仮説検定を単純に使うと自動的に再現性の危機が発生し、効くと判定された薬の中に効かない薬が数十%の割合で含まれるようになる。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 薬の承認制度が、事前登録された研究計画の仮説検定の結果しか認めないだけではなく、多段階勝ち抜き戦になっている必要がある理由は、1段階で終わらせると、HARKingやp-hackingの類を十分に防いでも、効かない薬が承認される割合が高くなってしまうからです。(小5レベルの割合計算で分かる。)

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 条件付き確率(ベイズの定理)の説明のために、 病気かどうかを調べる検査では、検査する人たちの中に実際に病気の人が十分高い割合で含まれていないと、偽陽性率が高くなってしまうこと をよく例に使います。P値<αという条件を使う仮説検定についても同じことを言えます。

黒木玄 Gen Kuroki@genkuroki

トレンド22:39更新

  1. 1

    エンタメ

    君は僕のもの初披露

    • ベテルギウス
    • HUENINGKAI
    • 君は僕のもの
    • 青島くんはいじわる
    • TOMORROW X TOGETHER
    • Snow Man
  2. 2

    エンタメ

    RYOKI

    • ELLY
    • 櫻井さん
    • SOTA
    • 本当にありがとうございました
    • 本当に楽しかった
    • RIMA
    • 田中樹
  3. 3

    サクラップ

    • 翔くんのラップ
    • 櫻井くん
    • ご唱和ください
    • 日本全国ご唱和ください
    • 翔ちゃん
    • ご唱和ください!
    • さくらっぷ
  4. 4

    エンタメ

    ハンドマイク

    • SQUARE_ONE
    • BON
    • 10時台
    • SQUARE ONE
    • 岸くんの声
    • メッキ剥がれてからが人生
    • またcm
    • 岸くんのビジュ
    • おかわり
  5. 5

    エンタメ

    halfmoon

    • King & Prince
    • MUSIC DAY
    • ハーフムーン
    • MUSIC
  6. 6

    ニュース

    さくらガール

  7. 7

    グルメ

    恋と深空

    • 深空
    • モーツァルト
    • イラスト
  8. 8

    エンタメ

    Eighdays

    • エイデイ
    • SUPER EIGHT
    • 大倉くん
    • 村上くん
    • sumika
    • 安田くん
    • グループのため
  9. 9

    アニメ・ゲーム

    キッド様

    • コナンくん
    • 青い薔薇
    • きょもちゃん
    • 青いバラ
    • KAT-TUN
    • 羽鳥さん
    • きょもめろたん
    • キッドからファンサ
    • コナン君
    • ファンサ
    • コナン
    • よかったねー
  10. 10

    エンタメ

    KAITA

    • ichiban
    • エモーショナルズ
    • 髙橋海人
    • SOTA
    • How Low
20位まで見る
よく使う路線を登録すると遅延情報をお知らせ Yahoo!リアルタイム検索アプリ
Yahoo!リアルタイム検索アプリ