- すべて
- 画像・動画
並べ替え:新着順
Rで学ぶ確率統計(’21)第7回 統計的仮説検定① 統計的仮説検定の考え方と、1標本の母平均の検定、2標本の母平均の差の検定の説明。考え方になかなか慣れないところです。Rでは実際に検定を行う方法。さくっと計算してくれるけど、前提と仮定を理解して検定方法を選択しないとね...
返信先:@ibu_hoshina仰る通り、探索的研究で仮説検定を持ち出す必要はないです。推定とかで見た方が良いと思います。 なのになぜか医学研究では検定をしてp値を出したがる慣習があります。 (Fisher流で有意水準を導入しないならまだある程度参考になりますが)多重性の補正をしろ、というのは流石に理解できないです。
「多重検定をするなら調整しろ、というのは厳しい」とか「研究を萎縮させる」的な意見を見たけど、いやダメでしょとしか言えない。 そもそも仮説を発見するために統計的仮説検定をわざわざ持ち出す必要があることはそんなに無いのでは? それに、(続)
#統計 P値もまた推定のための道具であったという説明の仕方は、2値的判断を強いる仮説検定よりも、確率的及びそれ以外の原因で生じる不確定性を考慮した推定の重視への移行という流れにも合致しています。 推定のための基本的な道具としてP値が重要なことを強調すれば良い。
#統計 P値を「P値<α」という条件による2値的判断のための道具としてではなく、推定の道具だとみなることは、教科書には載っていません。 教科書の権威に従いたい人達には難しいことのように感じるかもしれませんが、グラフを描いて素直に見れば何も難しいことはありません。 biostat.ucdavis.edu/sites/g/files/…
通常の仮説検定において棄却される「帰無仮説」は「帰無仮説 "以下"」or「帰無仮説 "以上"」のことだが一般的に "以下" や "以上" は省略されてしまってる。『差がないという仮説』は「帰無仮説 一点」であることを明示してしまってるので、根本的な誤解を露呈してる。 x.com/mph_for_doctor… pic.twitter.com/ILEyNpO1fW
普通に人前で浅い知識をひけらかして間違ったことを言うとか恥だと思うし専門家に向かって間違った知識を説くとか赤っ恥以外の何者でもないと思うんだけど、医療の世界ではマジでなんでこんな××な人が後を絶たないのか理解不能なんよな。 ひょっとして医者に医療知識で勝てると思ってる??
仮説検定の教え方について議論があったようで例の攻撃的な文化の担い手な人々によるインサルトが行われてそうと予想したら意外とそうでもなかった (無作為標本や正規性等の)仮定の下での帰無仮説という話は自分も強調するようにしてるので共感すら覚えた 迂闊にコメントすると攻撃されそうで怖いけど
返信先:@AkiraOkumura例えば、データが独立しているにもかかわらず、回帰モデルを適用すると、回帰係数が有意になる場合があります。具体的には、20回の独立した仮説検定を行うと、少なくとも1回の有意な結果が得られる確率は 1 - (1 - 0.05)^20 ≈…
#統計 不正無しであっても、ほぼ確実に帰無仮説が成立していると考えられる状況で仮説検定による2値的な判断をしてはいけないことを示すための例として、私は「財布から無作為に取り出した硬貨」をよく例に使っています。続く
#統計 仮説検定は理想的に行われた場合であっても取り扱い注意です。 教室にいる無作為に選んだ生徒に財布から10円玉または100円玉を無作為に取り出させて5回投げさせたら5回続けて表が出たならば、片側P値は1/32≈3.1%です。これを理由にその硬貨が細工されていると判断するのはナンセンスです。
この本でもフィッシャーの有意性検定とネイマン・ピアソンの仮説検定の両方が紹介されていますが、中身にはあまり踏み込んでおらずエピソードの紹介が中心です。 統計学を拓いた異才たち: 経験則から科学へ進展した一世紀 amzn.asia/d/eC8HeqF
95%CI (95%BCI) は n が多いほど良い(事前分布がテキトーでもベイズにおける中心極限定理がよく効く)ので、仮説検定のサンプルサイズ計算に合わせて n を少なめに堅持すると、95%CI (95%BCI) が役に立たなくなってしまう。
「n が巨大だとほぼ確実に統計学的有意差ついてしまうからサンプルサイズ計算にピッタリ合わせなければならない」といわれるが、仮説検定は真値が+側にあるか−側にあるかの分類・判定でしかないので、極小の真値は検出した(統計学的有意差ついた)方が良い。効果量は 95%CI (95%BCI) で判断するもの
ベイズを理解してなければ「P値(に基づく仮説検定)」を十分に理解することは絶対に不可能。標準的な状況において、P値が小さくても、帰無仮説値の事前確率が高ければ帰無仮説値は棄却すべきでない、とかね。 x.com/megikaya/statu…
「P値(に基づく仮説検定)のモデル」(t分布とか)に「欠測値があるからその観測値バイアスかかってる」とかを含めるのはナンセンス。上級者を装う人が犯す手口。黒木助教も「P値以外の不確実性あるからフィッシャー検定もモデル」的な解説したがP値の分布とは関係ない。モデルとは分布形状のこと
故に、信頼区間は「アメリカ統計学会による信頼区間に関する声明文」を発出して禁止すべき。P値よりも遥かに危険。仮説検定も信頼区間と同様に禁止した方が良い。 x.com/ueafam/status/…
Erik Zwet: Andrew Gelman:言わずと知れた統計学の世界最高権威級 Sander Greenland:黒木助教曰くノーベル賞級 Guido Imbens:ノーベル経済学賞 2021年 受賞 Simon Schwab: Steven Goodman:医学において世界で最も賢いとみなされている John Ioannidis と共同創設者・共同代表者 @METRICStanford
帰無仮説値が真値であることは、相殺されたシナリオを含有してるので、効果が無いことを意味してない。 P値や仮説検定の定義や解釈をまともに理解してなければ医学論文をまともに読み取ることは不可能だし、臨床に活かすことも絶対に不可能。 x.com/megikaya/statu…
『*疫学研究者はほとんどがわかっているはずです(しっかり習うので)』 それは完全に間違い。むしろ統計学者でさえ、P値や仮説検定を専門としてるくらいでなければ信用できない。 x.com/megikaya/statu…
一部を切り取って強調し、自分がP値の定義(←解釈ではない)を理解できなかったことを正当化しようとしてる。P値(に基づく仮説検定)の解釈が抽象的である側面があるのは、P値以外の不確実性が原因なので、P値そのものは抽象的に解釈すべきではない。
ここ数日の日本語圏𝕏上でのP値の話題で「帰無仮説とは具体的に何か?」を解説した専門家が1人も登場しなかったことは、「P値に基づく仮説検定」をまともに理解してる専門家など1人もいないことを露呈してる。 x.com/ueafam/status/…
例えば、肥満治療薬の臨床試験 (RCT) で点推定値がこうだとすると(n は群間で一致してるとする) プラセボ群:-4 kg _治療薬群:-8 kg この場合の帰無仮説は、多くの専門家がこう答えるだろう。 プラセボ群:-4 kg _治療薬群:-4 kg 正解はこう。 プラセボ群:-6 kg _治療薬群:-6 kg
#統計 大学以上での統計学教育の内容は杜撰。そういう環境の中で高校数学のカリキュラムに仮説検定が捩じ込まれた結果、酷いことになっています。 例えば学習指導要領解説(学習指導要領とは厳密に異なる文書)には添付画像のように書いてあります。対照群を設けていない。 mext.go.jp/content/202302… pic.twitter.com/zHNbbvLuu3
#統計 高校での統計学教育の悲惨な現状を示唆する資料1/3 学習指導要領(告示)とは厳密に異なる文書(単なる文科省著作物)の学習指導要領解説(高校の数学編理数編)に書いてある 新素材の枕を使用した30人中80%が以前よりよく眠れた と回答した件の扱いが酷い。続く mext.go.jp/content/202302…
P.4の表現がとてもいいし、わかりやすい。 / 他2件のコメント b.hatena.ne.jp/entry/s/speake… “仮説検定とP値” htn.to/4af4wLZEss #資料 #統計 #データ