- すべて
- 画像・動画
並べ替え:新着順
渋幕の過去5年平均の東大現役合格率は、帰国生(17.1%)が 一般生 (14.6%)より高い結果となりました。ではこの差は統計的に有意でしょうか? →カイ二乗検定のp値を計算すると約0.4-0.5。帰国生と一般生の合格率の差は統計的に有意とは認められません
🦁/ポンさんパス/3P/値5 ぽんハウスに泊まりたいということで来た案件 会ったらイケメンとヤリたいと言われ3P 🦁スト/値1.5 座ってる泥に声掛けてノーグダ即 🦁スト/25/背苦脚馬/値4 声掛けたらスカウト?言われて内緒って言ったらスカウトの方がありがたいって言われ開示 面接組んだ後にカス搬して
2009年出版のPRMLは次の特徴がある。 ①豊富なデータを前提にしたベイズモデルの解説なので2巻を通じてP値の記載が一切ない ②2章の神嶌先生の多変量混合正規分布の記述が秀逸 ③11章の持橋先生の変分(潜在変数)推定の記述が秀逸 ④但しXgboostで使う確率勾配Boostingの記述が無い
超有名本「パターン認識と機械学習」「深層学習」は東大松尾研の輪読会で資料がまとめられており、無料公開されている。 いつか読みたいと思ってたけど、ここにあるスライドで概要は把握できそう。 本当にありがたい。 deeplearning.jp/seminar-2/#164…
#統計 添付画像①の非対称な分布が2つの仮想的な母集団分布で標本サイズが80, 20の場合に、WelchとStudentのt検定のP値≤αとなる確率のグラフが添付画像②で、Welchの側がliberalになっています。 しかし、不等母分散の場合にStudentの側は大きく破綻し易い(添付画像③④)。 nbviewer.org/github/genkuro… pic.twitter.com/bsA9FADYLW
Tukey:等分散のときは制御できてるけど、不等分散のときはちょくちょく5%を超えてる。 「等分散のとき」の条件付きなのがよくわかる。 Games-Howell:どの場合でも制御できてた。 分散がsimilarのときはFWERに対してliberalになる(Kirk, 1994)はどの場合を指して言っていたんだろう? 今後も要検討
★休日は統計の勉強をがっつり進めます‼️ 今日も中1息子と朝マック☕ #朝活 ✅Excelで学ぶ実践ビジネスデータ分析 ・エクセル分析スペシャリスト対策 ・Excelデータを元に手を動かし、p値を求めたり、散布図を書いたり、回帰直線やR2を求めたり。 #統計 は分かってくるとドンドン面白くなりますね😊 pic.twitter.com/Zbr4uQilOO
#統計 「θ=0」型のゼロ仮説のP値だけではなく、「θ=a」(aは任意の数値)の型の一般の検定仮説のP値の話をしたいときの困難の1つは、主要な統計ソフトの仕様がそのようになっていない場合が多いことです。 2×2の分割表でのχ²検定の実装のあるべき仕様は以下の通り。 pic.twitter.com/2wywkdfB2z
#統計 2×2の分割表に関するχ²検定の実装のあるべき仕様は ①デフォルトでは連続性補正を一切適用しない。 ②オッズ比、リスク比、リスク差の信頼区間を計算してくれる。 ③オッズ比、リスク比、リスク差の値に関する検定仮説のP値を計算してくれる。 ④P値関数のグラフを作画してくれる。
#統計 P値の説明を正確にできるようになるためにはモデルの確率分布の中身を正確に理解する必要があります。しかし、多くの人にとってそれは困難です。 次善の策として、P値が データの数値と モデル+パラメータの値の設定 の相性の良さの指標の1つ であることを強調するという手があると思う。 pic.twitter.com/pSQhbq2HIZ
返信先:@shiraishia_md#統計 P値の無難な解釈について補足 「検定仮説の下でのモデル内確率分布によって観察データ以上に極端な値が生成される確率(の近似値)」=P値は、 使用しているモデルの下での(←この制限を忘れるとアウト) 検定仮説とデータの数値の相性の良さ(compatibility)の指標 の1つだと解釈されます。
返信先:@shiraishia_md#統計 P値は点推定だけではなく、区間推定の方法も与えます。 「リスク比はaである」の(両側)P値がα以上になるaの範囲は、リスク比に関する信頼水準1-αの信頼区間になります。 以上のP値の使い方についてはGreenlandさん達がずっと解説して来てくれています。P値は推定の道具として使うべきです。
返信先:@shiraishia_md#統計 「リスク比は1.6である」という検定仮説のP値が13%ならば、使用しているモデルの下で「リスク比は1.6である」という仮説とデータの数値は相性は悪くないのように解釈できます。 「リスク比は2.5である」のP値が1の場合には、2.5はリスク比の点推定値になります。続く
返信先:@shiraishia_md#統計 例えば「リスク比は1である」というゼロ仮説のP値が0.1%ならば、使用しているモデルの下で「リスク比は1である」というゼロ仮説とデータの数値は相性が非常に悪いと通常判断します。続く
返信先:@shiraishia_md#統計 P値の無難な解釈について補足 「検定仮説の下でのモデル内確率分布によって観察データ以上に極端な値が生成される確率(の近似値)」=P値は、 使用しているモデルの下での(←この制限を忘れるとアウト) 検定仮説とデータの数値の相性の良さ(compatibility)の指標 の1つだと解釈されます。
返信先:@shiraishia_md#統計 補足。帰無仮説という言い方を廃して説明し直すと、大雑把にP値は 検定仮説の下でのモデル内確率分布によって観察データ以上に極端な値が生成される確率(の近似値) だと説明できます。 検定仮説の典型例は「リスク比は2.34である」(その場合のゼロ仮説は「リスク比は1である」)の類です。
#統計 P値は 帰無仮説下のモデル内確率分布によって観察データの数値以上に極端な値が生成される確率(の近似値) だとよく説明されます。ただしこの言い方だと「~以上に極端な値」の意味が曖昧になるので、この説明はかなり大雑把です。
振子時計の論考なんだけど,振子はQ値(振子が持つエネルギー/1周期で失うエネルギー)だけではなくP値(1周期で失うエネルギー/脱進機が振子に与えるエネルギーの変動)も重要なのではないかというお話. 正確な時計を作るためにはQだけではなくP×Qを大きくする必要があると. leapsecond.com/hsn2006/pendul…
返信先:@kamokita1P値は、現実における1回の実験観察で得られたデータの数値以上に極端な値に、帰無仮説下のモデル内確率分布で生成されたデータの数値がなる確率です。 ただし、これは非常に大雑把な説明で、これを正しいP値の定義だと思ってしまうとまずい。このことも多種のP値の実装をやれば分かります。続く
ワクチン効果を見るために 表1のage adjusted deathを 2020年を基準値として計算しました。 1. 2022年は2021年に比べて 超過癌死亡(P値)が3倍に増加。 2. 脳腫瘍、白血病、女性の癌(乳がん、卵巣、子宮)の増加が顕著。 そういえばこの前大学の先輩が白血病で亡くなった。 x.com/mbi92710920/st… pic.twitter.com/oAar3pXwLt
ワクチン効果を見るために表1のage adjusted deathを2020年を基準値として計算しました。 1. 2022年は2021年に比べて超過癌死亡(P値)が3倍に増加。 2. 脳腫瘍、白血病、女性の癌(乳がん、卵巣、子宮)の増加が顕著。 そういえばこの前大学の先輩が白血病で亡くなった。 ncbi.nlm.nih.gov/pmc/articles/P…
ESC-HF【MI後SGLT2-iが転帰に及ぼす影響はDM合併の有無に影響受けず:EMPACT-MI事前設定解析】 MI後HF高リスク3260例ランダム化、17.9ヶ月観察:SGLT2-i群の対プラセボ「総死亡・HF初回入院」HRはDM「非合併」例で0.76 [95%CI 0.53-1.09]、「合併」例も0.94 [0.73-1.21]。交互作用p値は0.41。
ワクチン効果を見るために表1のage adjusted deathを2020年を基準値として計算しました。 1. 2022年は2021年に比べて超過癌死亡(P値)が3倍に増加。 2. 脳腫瘍、白血病、女性の癌(乳がん、卵巣、子宮)の増加が顕著。 そういえばこの前大学の先輩が白血病で亡くなった。 ncbi.nlm.nih.gov/pmc/articles/P… pic.twitter.com/jfKLf1QzNy
#統計 Rのfisher.testについてはその欠点を修正したexact2x2パッケージがある。 exact2x2でのFisher検定の仕様 ①minlikやcentralなど複数のP値の定義を使用可能。 ②オッズ比の信頼区間を計算してくれる。 ③オッズ比を任意の値に設定する検定仮説のP値も計算可能。 ④P値関数も作画可能。
#統計 そういう効率の悪い計算法を甘受し、精度を落とす犠牲を払って、広めになる信頼区間の定義を #R言語 のfisher.testは採用しています。 その辺を訂正したのが、library(exact2x2)のexacr2x2函数だとみなせます。
#統計 2×2の分割表に関するχ²検定の実装のあるべき仕様は ①デフォルトでは連続性補正を一切適用しない。 ②オッズ比、リスク比、リスク差の信頼区間を計算してくれる。 ③オッズ比、リスク比、リスク差の値に関する検定仮説のP値を計算してくれる。 ④P値関数のグラフを作画してくれる。
返信先:@Iguchi_YRのchisq.testでの2×2の分割表の取り扱いでは ❌デフォルトでYatesの連続補正をする という仕様も問題だし、 ❌オッズ比、リスク比、リスク差の信頼区間を計算してくれない のも問題でちょっと実用的ではない感じ。 誰かまともなχ²検定のパッケージを作って欲しい。すでにあるなら教えて欲しい。
返信先:@rakuslckita残念ながら「曲線下面積が1」にはなりません。P値関数は確率密度関数ではないです。 事後分布の確率密度関数のグラフでは「曲線下面積が1」にはなります。 実際にP値関数のグラフと事後分布の確率密度関数のグラフをコンピュータで描くと楽しめると思います。
返信先:@genkuroki効果はaである仮説のp値、効果はa'である仮説のp値、と際限なく計算しつづけ、縦軸にp値、横軸を効果量として、曲線下面積が1になる曲線をひいてあげて…あ、これはアレだ…
返信先:@ueafam他1人よく誤解されていることですが、有意確率p値は標本が棄却域に入っているかどうかを調べるための便宜的な値にすぎません。 1/3 snap-tck.com/room04/c01/sta… pic.twitter.com/TzKHeFRktz
仮にp値を帰無仮説が正しい確率とみなすなら1-(p値)は対立仮説が正しい確率とみなすことができるはずだが、95%の確率で効果があるとは誰も言わないのでなんとなくこれだけで違うことがわかるような気がする
細かいところで分からないところはまだあるのだけれど、 1. modified poissonでsandwich分散の方が標準誤差が小さくなるのとはどんなときなのか? 2. sandwich分散を使ったときのP値をどう計算するのか? が特に大きな未解決ポイントデス。
サンドイッチ分散の計算を実装する編も書きました。大体合っているけれど、まだズレることがあります。。。 Modified Poissonを理解する - PART2 実装編|ironman zenn.dev/ironman/articl… #zenn
f. 抗菌薬Aと抗菌薬Bは母集団の入院期間の平均に与える影響が等しい(つまりAは入院期間の平均を短縮も延長もしない)と仮定したときに、A群とB群の入院期間に1.5日かそれ以上の差がまぐれで出る確率は3.6%である。 ↑正しい 正しい選択肢作るの難しい。これだからp値は使いにくい。効果量書け。
#統計 P値について理解したい人は以下を読むと良いと思います。 佐藤俊哉著『宇宙怪人しまりす統計よりも重要なことを学ぶ』の第1話 asakura.co.jp/detail.php?boo… 『ロスマンの疫学第2版』の第8章 shinoharashinsha.co.jp/Books2.aspx?PI… Greenlandさんの講演スライド biostat.ucdavis.edu/sites/g/files/…
#統計 無数のP値を「データの数値とモデル+パラメータの値の設定の相性の良さの様子」を見るために使うことは、『ロスマンの疫学第2版』のような教科書に書かれています(添付画像)。 この場合のP値はモデルのパラメータとしての相対リスクの値と表8-1のデータの数値の相性の良さを意味する。 pic.twitter.com/h5MLiQMpRJ