自動更新

並べ替え:新着順

ベストポスト
メニューを開く

たびたび話題になる仮説検定P値について以前作成した資料を公開します(ぶっ込んでみます).端折るのは無理なので長いです. こわいよーこわいよー ・検定を繰り返すことで発生する「多重性の問題」について,統計的に制御する方法と考え方で制御する方法をまとめた shuntaro-sato.studio.site/blog/hypothesi…

Sato Shuntaro|佐藤俊太朗@Shuntarooo3

メニューを開く

#統計 P値<αという条件による2値的判断のためにP値について説明すると、危険で間違った説明になりがち。安全なP値の説明法が必要です。それが P値は、データの数値とモデル(検定したい仮説を含む)の相性の良さ(整合性、適合度)の指標の1つである なのです。この説明は2値的判断を前提にしていない。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 薬の承認のための治験は第1,2,3相に分割された多段階勝ち抜き戦のすべてに勝利する制度になっています。 最終の第3相までに効く可能性が十分にある薬のみを残すことに成功すれば、第3相での最終決着をP値<αを使う仮説検定で行ってもそれなりに合理的だということになります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 条件付き確率(ベイズの定理)の説明のために、 病気かどうかを調べる検査では、検査する人たちの中に実際に病気の人が十分高い割合で含まれていないと、偽陽性率が高くなってしまうこと をよく例に使います。P値<αという条件を使う仮説検定についても同じことを言えます。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

故に、信頼区間は「アメリカ統計学会による信頼区間に関する声明文」を発出して禁止すべき。P値よりも遥かに危険。仮説検定も信頼区間と同様に禁止した方が良い。 x.com/ueafam/status/…

Illusion of Evidence (IoE)@ueafam

Erik Zwet: Andrew Gelman:言わずと知れた統計学の世界最高権威級 Sander Greenland:黒木助教曰くノーベル賞級 Guido Imbens:ノーベル経済学賞 2021年 受賞 Simon Schwab: Steven Goodman:医学において世界で最も賢いとみなされている John Ioannidis と共同創設者・共同代表者 @METRICStanford

Illusion of Evidence (IoE)@ueafam

メニューを開く

❌『検定統計量もP値も 観測されたデータと特定の統計モデルが矛盾する程度 を表した指標』 ⭕「検定統計量もP値も 観測されたデータと特定の仮説値が矛盾する程度 を表した指標」 『統計モデル』→「仮説値」(SMD=0.00 とか SMD=0.82 とか)

Illusion of Evidence (IoE)@ueafam

完全に誤解してる(ASA声明文もだが):例えば二項検定の代表格「フィッシャーの正確検定」は統計モデルを使用してない。平均値の群間差 (MD) もモデルを使用せずに「(フィッシャーの)正確なP値」を計算した方が良い[Donald Rubin @HarvardStats pubmed.ncbi.nlm.nih.gov/32703808/, pubmed.ncbi.nlm.nih.gov/36685337/]

Illusion of Evidence (IoE)@ueafam

メニューを開く

完全に誤解してる(ASA声明文もだが):例えば二項検定の代表格「フィッシャーの正確検定」は統計モデルを使用してない。平均値の群間差 (MD) もモデルを使用せずに「(フィッシャーの)正確なP値」を計算した方が良い[Donald Rubin @HarvardStats pubmed.ncbi.nlm.nih.gov/32703808/, pubmed.ncbi.nlm.nih.gov/36685337/] pic.twitter.com/QiwPYXNfoT

Sato Shuntaro|佐藤俊太朗@Shuntarooo3

たびたび話題になる仮説検定やP値について以前作成した資料を公開します(ぶっ込んでみます).端折るのは無理なので長いです. こわいよーこわいよー ・検定を繰り返すことで発生する「多重性の問題」について,統計的に制御する方法と考え方で制御する方法をまとめた shuntaro-sato.studio.site/blog/hypothesi…

Illusion of Evidence (IoE)@ueafam

メニューを開く

『*疫学研究者はほとんどがわかっているはずです(しっかり習うので)』 それは完全に間違い。むしろ統計学者でさえ、P値や仮説検定を専門としてるくらいでなければ信用できない。 x.com/megikaya/statu…

Rik@予防医療@megikaya

炎上覚悟でかきました:P値について思うこと open.substack.com/pub/riklog/p/p…

Illusion of Evidence (IoE)@ueafam

メニューを開く

「アメリカ統計学会によるP値に関する声明文」やその日本語訳版にも誤解を招く記述が多く、実際に声明文内に名を連ねてる世界的権威の一部は声明文に十分に同意してない。モデルベースはNG。『5年生存率が高かった(60% vs. 50%など)』で使用されるフィッシャーの正確検定 x.com/megikaya/statu…

Rik@予防医療@megikaya

炎上覚悟でかきました:P値について思うこと open.substack.com/pub/riklog/p/p…

Illusion of Evidence (IoE)@ueafam

メニューを開く

返信先:@mrhonen#統計 再現性がない研究の原因をPハッキングのような不正行為に求める議論はミスリーディングで、仮説検定は理想的に行われてもそれ一発で判断すると再現性がない研究が量産されることの原因になります。 P値<αという条件だけでは科学的に信頼できる結果を出すことは原理的に不可能。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

京都大学大学院医学研究科 聴講コース 臨床研究者のための生物統計学「仮説検定P値の誤解」佐藤 俊哉 医学研究科教授 youtu.be/vz9cZnB1d1c?si… @YouTubeより

メニューを開く

#統計 具体例: Rのchisq.testで2×2の分割表の検定を実行すると、独立性の帰無仮説(「差がない」型のゼロ仮説の一種)のP値しか表示してくれない。ゼロ仮説に異様にこだわるnullismにフィットしている。(その上、やめて欲しいYatesの連続性補正をデフォルトで適用してしまう。信頼区間も計算しない。)

黒木玄 Gen Kuroki@genkuroki

#統計 2×2の分割表に関するχ²検定の実装のあるべき仕様は ①デフォルトでは連続性補正を一切適用しない。 ②オッズ比、リスク比、リスク差の信頼区間を計算してくれる。 ③オッズ比、リスク比、リスク差の値に関する検定仮説のP値を計算してくれる。 ④P値関数のグラフを作画してくれる。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

P.4の表現がとてもいいし、わかりやすい。 / 他2件のコメント b.hatena.ne.jp/entry/s/speake… “仮説検定P値htn.to/4af4wLZEss #資料 #統計 #データ

niraleverkick@iwanofsky

メニューを開く

p値は(検定統計量としての機能以外において)害悪だと思っているけど、「p値が小さいとうれしい」が燃えているのは何で?p値が(事前に設定した閾値よりも)小さいと(非ゼロだとうれしい検定統計量がゼロという帰無仮説が棄却されるので)うれしい、はそうじゃない?なんか勘違いしてる?

MASAYUKI SAWADA@masa1123

メニューを開く

p値関連の話がまたTLで増えてる。統計検定1級を受けようとしてる身が言うのもあれだが、「カセツケンテイヲセヨ」という問題で算出すべき値としか考えてないっす。🙃

五合目(統計検定1級合格したい!)@ESLbeginner

メニューを開く

#統計 ①のリンク2/2 佐藤俊哉さんの講義動画 youtu.be/vz9cZnB1d1c?si… 仮説検定P値の誤解 この動画は素晴らしいです。内容も素晴らしいですが,非常に聴きやすい点も驚異的だと思いました。自分の講義を録画したことがある人の多くはそう感じると思います。いやあ、これは本当にすごい。

黒木玄 Gen Kuroki@genkuroki

#統計 「統計的有意性とP値に関するASA声明」の翻訳者の佐藤俊哉先生による素晴らしい講義動画もよく紹介されています。これも統計学を教える仕事をする人は視聴しておいた方がよい。教科書に誤りが書いてあることを明瞭に説明している。教科書通りに講義をしてはいけない。 youtu.be/vz9cZnB1d1c?si…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

京都大学大学院医学研究科 聴講コース 臨床研究者のための生物統計学「仮説検定P値の誤解」佐藤 俊哉 医学研究科教授 youtu.be/vz9cZnB1d1c?si… @YouTubeより

somekita@特発性血小板減少症@EBIちゃん号@mazuisake

メニューを開く

仕事でもナンチャッテ統計p値の扱いが雑な人がいたりするので、分かりやすく説明できるようにしときたいね 別に帰無仮説のp値が有意水準にあっても元の仮説を全て肯定する要因にはならず、あくまで整合性の一要素ってことかな ≫P値は、検定したい仮説だけではなく、モデル全体を評価している指標

黒木玄 Gen Kuroki@genkuroki

#統計 P値や信頼区間の使い方(もしくは誤用の仕方)に関する決定的な解説がGreenlandさんの講演スライド biostatistics.ucdavis.edu/sites/g/files/… にあります。これの発見が遅れて時間を無駄にした。 添付画像はそのp.75の翻訳。

メニューを開く

#統計 P値が非常に小さな値になったことから分かることは データの数値 と モデル+検定したい仮説によるパラメータの値の設定 の相性が非常に悪いということだけです。 データ取得法の適切さやモデルの妥当性などの統計分析における本質的なことはP値を見ても何も分からない。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

P値については佐藤俊哉先生の講義がとてもわかりやすいです(なかなか自分で説明できるようになるまでは難しいですが) 京都大学大学院医学研究科 聴講コース 臨床研究者のための生物統計学「仮説検定P値の誤解」佐藤 俊哉 医学研究科教授 youtu.be/vz9cZnB1d1c?si… @YouTubeより

Shungo Y@bizarreID

メニューを開く

仮説検定P値|佐藤俊太朗(生物統計学・疫学) shuntaro-sato.studio.site/blog/hypothesi… これは素晴らしい資料.これくらい説明しないと誤解釈や誤用やp-hackingの防衛にならないという…

Yuta Kashino@yutakashino

メニューを開く

そもそもp値が仮説検定というプロセスの本体とは別の話で、単純化すれば帰無仮説のもとである統計量Wの実測値wが事前に定めた定数cより大きければ帰無仮説を棄却するのが検定で、帰無仮説のもとで統計量W>wとなる確率がp値で、帰無仮説のもとでW>cとなる確率がαとなる様にcを定めるという話

地下楽師@Ph.D@tonkyo_Vc

メニューを開く

p値の定義なんて聞かれたら検定統計量をWとしてP(W(X)≤α)≤αと答えざるを得ない。

遠野びび(..◜ᴗ◝..)@Vi_Breeds_Vi

メニューを開く

これ、p値の説明間違ってない? 「統計的仮説検定において、帰無仮説の元で検定統計量がその値以上に極端な値になる確率」では…

TJO@TJO_datasci

p値の説明、大体これで良いのでは「統計的仮説検定において帰無仮説の元で検定統計量がその値となる確率…p値が小さいほど検定統計量がその値となることはあまり起こりえないことを意味する。一般的にp値が5%または1%以下の場合に帰無仮説を偽として棄却し対立仮説を採択」 bellcurve.jp/statistics/glo…

しば漬け@1kn29cgQJzRwtgd

メニューを開く

#統計 以上を理解した人は「P値は所謂NHST(帰無仮説有意性検定)のための道具である」という考え方はもはや論外だと感じるはずです。 「P値は所謂NHSTのための道具である」という間違った思い込みの下で「P値ではなく、ベイズを使え」と言っている人も無教養人扱いで問題ありません。たまに見ます。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

p値の説明、大体これで良いのでは「統計的仮説検定において帰無仮説の元で検定統計量がその値となる確率…p値が小さいほど検定統計量がその値となることはあまり起こりえないことを意味する。一般的にp値が5%または1%以下の場合に帰無仮説を偽として棄却し対立仮説を採択」 bellcurve.jp/statistics/glo…

メニューを開く

#統計 P値が推定のための道具であることについても、Greenlandさんの講演スライドを参照。 P値は、2値的判断を迫る検定のためにではなく、データの数値との相性の良さを連続的に評価するタイプの推定のための道具として使える。 biostatistics.ucdavis.edu/sites/g/files/… pic.twitter.com/r01sm4giVg

黒木玄 Gen Kuroki@genkuroki

#統計 P値を ❌「効果ゼロ」という帰無仮説に関する検定の道具 とみなすのではなく、 ⭕️推定の道具 とみなすべきであることについては、Greenlandさんの講演スライドを参照。 この講演スライドに目を通しておくと、P値に関するおかしな議論に関わる時間を減らせます。 biostatistics.ucdavis.edu/sites/g/files/…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

p値よりも、「推測統計学とは何か」、「統計学的仮説検定とは何か」を答えさせるべきだと思う。

竹内幹@takekan

「p値」って何といわれて全く答えられない人に、計量経済入門の単位とか認定しちゃだめだよなあ、と思っている。 ざっくりいえば、p値(p-value)は「ある結論が、実はただの勘違いである可能性」と解釈できる。(小声でいうと、小さい方がうれしい) 例えば、学生グループAとBのテストの成績差。

ナシェモン@nassyemon

メニューを開く

p値は言葉の定義だと頭が混乱するので、t値に対応しているものならきれいな山を、カイ2乗値なら歪んだ山を思い浮かべて、そのヘリの部分の確率なんだと図形で理解するようにしています。 なお、統計パッケージの出力で推定結果についてくるやつは片側検定p値なので、そのまま推定結果表をつくると...

シラカワスキー@shirakawa_love

p値について試しに自宅にある教科書を全部見てみたがどれもちゃんとした説明だった。面白かったのは統計検定2級の公式テキストで「漠然と定義される」だそうです。

ときわ総合サービス研究所@tokiwa_soken

メニューを開く

#統計 P値から分かることは、データの数値とモデルの相性の良さ(整合性、適合度)だけで、モデルの一部分であるパラメータの値に関する仮説に関する判断にはさらに別の議論が必要になる。 「P値を使えばαの危険率で検定したい仮説の成否を判定できる」という主張も実践的には完全に間違っています。

黒木玄 Gen Kuroki@genkuroki

#統計 「統計的有意性とP値に関するASA声明」でも他の真っ当なすべての解説でも、P値<αという条件による安易な2値的判断をしてはいけないということになっています。 「統計的有意性」で結論を出すこと自体が有害であるというコンセンサスがすでにあるようにも見える。 biometrics.gr.jp/news/all/ASA

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 添付画像は上で引用したP値の解釈に関する原則1の終わりの部分です。 P値が、検定したい仮説単体ではなく、P値の計算に使われた仮定の全体(モデル)に結び付いている値であることを強調しているからこそ、こういう結論を容易に述べることができるのです。 biometrics.gr.jp/news/all/ASA pic.twitter.com/sLTKJYYI8r

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 ASA声明では 1. P値は[観測]データ[の数値]と特定の統計モデル(訳註: [検定したい]仮説も統計モデルの要素)が矛盾する程度[小さい方が矛盾する程度が強い]をしめす指標のひとつである。 と、P値検定したい仮説単体ではなく、モデル全体に結び付いていると説明しています。これ重要。 訂正版 pic.twitter.com/JlyMs9zysL

黒木玄 Gen Kuroki@genkuroki

#統計 統計学を教える仕事をする人は 統計的有意性とP値に関するASA声明 biometrics.gr.jp/news/all/ASA には目を通しておいた方が無難。 これを読めば、P値に関する実践的に十分な説明と解釈法が得られます。 ただし添付画像への追記部分に注意することも必要。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 小さなP値が得られたときには、通常、検定したい仮説だけではなく、「モデルが間違っている」(調整するべき(してはいけない)変数で調節していない(している)ことなども含む)や「データの取得法に問題があった」の可能性も疑ってみるのが普通でしょう。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値は、β₁=0のような検定したい仮説だけではなく、モデル全体(β₁=0については回帰モデル全体)と観察データの数値の相性の良さ(整合性、適合度)の指標の1つです。 P値は、検定したい仮説だけではなく、モデル全体を評価している指標であることが忘れられがちなので注意が必要。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値と尤度(ゆうど)の違いが明瞭であるような説明をしていない場合はアウト。 P値が、現実においてではなく、検定したい仮説の下でのモデル内確率分布で計算した確率であることが分からない説明もアウト。 統計的有意性(P値<α)によって科学的結論を出すことに否定的でない説明もアウト。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値は、大雑把には、 観察されたデータの数値以上に極端な値が、検定したい仮説の下でのモデル内確率分布に従って生成される確率もしくはその近似値。 尤度の定義は、 観察されたデータの数値と同じ数値が、モデル内確率分布に従って生成される確率またはその密度。 混同させる説明が多い。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

p値について試しに自宅にある教科書を全部見てみたがどれもちゃんとした説明だった。面白かったのは統計検定2級の公式テキストで「漠然と定義される」だそうです。 pic.twitter.com/kHuhtf8MEL

シラカワスキー@shirakawa_love

メニューを開く

趣味で取った統計検定、、結局使うことがなくて、p値と聞いても頭から何も出てこなくなった。 勉強時間がもったいないから目的が明確でない資格は取らんほうがいいな、 継続して勉強し続けるなら別だけど、

メニューを開く

p値って特定の検定統計量の理論分布に基づいて計算されるものだと思うので、検定統計量をベースに考えたほうが良いと思うんだけどな x.com/daikitaoka/sta…

竹内幹@takekan

「p値」って何といわれて全く答えられない人に、計量経済入門の単位とか認定しちゃだめだよなあ、と思っている。 ざっくりいえば、p値(p-value)は「ある結論が、実はただの勘違いである可能性」と解釈できる。(小声でいうと、小さい方がうれしい) 例えば、学生グループAとBのテストの成績差。

TAOKA Daiki@DaikiTAOKA

メニューを開く

このほかにも、フィッシャーvsネイマンピアソンやNHSTにおけるp値の考え方等、統計検定向けの勉強本には記載されてない情報や誤解してた箇所を見直すとても良い機会になりました

あしたま@GALC_09C_09C

トレンド9:56更新

  1. 1

    アニメ・ゲーム

    クロスプレイ

    • モンスターハンターワイルズ
    • モンハンワイルズ
    • ワイルズ
    • モンハン
  2. 2

    アニメ・ゲーム

    伝説の新人剣士

    • SGF
    • 新人剣士
    • 崩壊スターレイル
    • スターレイル
  3. 3

    海竜種

    • バーラハーラ
    • ラギアクルス
    • ラギア
    • ガイアデルム
    • インド神話
  4. 4

    ベガ

    • テリー
    • Summer Game Fest 2024
    • Year2
    • バイソン
    • ストリートファイター6
    • スト6
    • シャドルー
    • ストリートファイター
    • ベガ立ち
    • Summer Game Fest
  5. 5

    エンタメ

    青島くんはいじわる

    • 主演ドラマ
    • 君は僕のもの
    • 渡辺翔太
    • Snow Man渡辺翔太
  6. 6

    エンタメ

    BABA抜き

    • BABA抜き最弱王決定戦
    • 松本潤、
    • 最弱王
    • 相葉くん
    • 3年半
    • えなりかずき
    • 松本潤
    • BABA抜き最弱王
    • 相葉雅紀
    • 潤くん
    • 相葉
  7. 7

    ニュース

    ニコニコサービス全体

    • 緊急メンテナンス
    • まだ8時
    • 不具合が
  8. 8

    餓狼伝説

    • 餓狼
    • ジェニー
    • スト6
    • 餓狼伝説 City of the Wolves
    • グラント
    • Lee
  9. 9

    エンタメ

    ドームツアー初日

    • 最後まで全力で
    • キスマイ
    • キス担
    • ツアー初日
    • Kis-My-Ft2
  10. 10

    ITビジネス

    ドシャグマ

    • モンスターハンターワイルズ
    • ハンター
20位まで見る

人気ポスト

電車遅延(在来線、私鉄、地下鉄)

遅延している路線はありません

全国の運行情報(Yahoo!路線情報)
よく使う路線を登録すると遅延情報をお知らせ Yahoo!リアルタイム検索アプリ
Yahoo!リアルタイム検索アプリ