自動更新

並べ替え：新着順

ベストポスト

渋幕の過去５年平均の東大現役合格率は、帰国生（17.1%）が一般生（14.6%）より高い結果となりました。ではこの差は統計的に有意でしょうか？ →カイ二乗検定のp値を計算すると約0.4-0.5。帰国生と一般生の合格率の差は統計的に有意とは認められません

Kikoku2026@kikoku2026

昨日 11:53

メニューを開く

自由度が高すぎるせいでp値が1にぃ！

K.K.J.@KKJ_kyo_ko_jo

昨日 22:32

メニューを開く

1年前はp値が出てきた時に桃？と思ってたのだから、これでも進歩したんだよ（違

外れ値@shakaijin_insei

昨日 13:38

メニューを開く

🦁/ポンさんパス/3P/値5 ぽんハウスに泊まりたいということで来た案件会ったらイケメンとヤリたいと言われ3P 🦁スト/値1.5 座ってる泥に声掛けてノーグダ即 🦁スト/25/背苦脚馬/値4 声掛けたらスカウト？言われて内緒って言ったらスカウトの方がありがたいって言われ開示面接組んだ後にカス搬して

KAISER@レナ講習@kaiser_pua

昨日 3:56

メニューを開く

このp値姫、 1%なのか5%なのかで話がだいぶ変わってくるな

ゆとり脊椎外科医@spine_surgeon_5月21日(火) 13:02

p値姫（サンプル数編）

のしたーん@AcceleGilgamesh

5月21日(火) 23:56

メニューを開く

#統計だから、p≠1/2の場合には、大数の法則によって、m,nを大きくすると、WMW検定でのP値がα未満になる確率は1に近付きます。そのような状況でαエラー率のαからの乖離について調べても無意味です。だからp=1/2になるようにテストで使う確率分布を調整する必要があります。

黒木玄 Gen Kuroki@genkuroki

5月21日(火) 19:15

メニューを開く

返信先:@Mahal不幸なタイミングで僕のTLにP値姫という秀逸なネタが飛んで来たので、それと比較しちゃうとマイナス1σです。

えどわう@aeolic_guardian

5月21日(火) 18:19

メニューを開く

2009年出版のPRMLは次の特徴がある。 ①豊富なデータを前提にしたベイズモデルの解説なので２巻を通じてP値の記載が一切ない ②２章の神嶌先生の多変量混合正規分布の記述が秀逸 ③11章の持橋先生の変分(潜在変数)推定の記述が秀逸 ④但しXgboostで使う確率勾配Boostingの記述が無い

A7｜データサイエンティスト目指してる大学院生@A7_data2023年5月25日

超有名本「パターン認識と機械学習」「深層学習」は東大松尾研の輪読会で資料がまとめられており、無料公開されている。いつか読みたいと思ってたけど、ここにあるスライドで概要は把握できそう。本当にありがたい。 deeplearning.jp/seminar-2/#164…

mabo@mabonki0725

5月20日(月) 15:04

メニューを開く

#統計添付画像①の非対称な分布が2つの仮想的な母集団分布で標本サイズが80, 20の場合に、WelchとStudentのt検定のP値≤αとなる確率のグラフが添付画像②で、Welchの側がliberalになっています。しかし、不等母分散の場合にStudentの側は大きく破綻し易い(添付画像③④)。 nbviewer.org/github/genkuro… pic.twitter.com/bsA9FADYLW

Takuto SAKAI@tsakai_psych5月19日(日) 14:37

Tukey：等分散のときは制御できてるけど、不等分散のときはちょくちょく5%を超えてる。「等分散のとき」の条件付きなのがよくわかる。 Games-Howell：どの場合でも制御できてた。分散がsimilarのときはFWERに対してliberalになる（Kirk, 1994）はどの場合を指して言っていたんだろう？今後も要検討

黒木玄 Gen Kuroki@genkuroki

5月19日(日) 22:28

メニューを開く

★休日は統計の勉強をがっつり進めます‼️ 今日も中1息子と朝マック☕ #朝活 ✅Excelで学ぶ実践ビジネスデータ分析・エクセル分析スペシャリスト対策・Excelデータを元に手を動かし、p値を求めたり、散布図を書いたり、回帰直線やR2を求めたり。 #統計は分かってくるとドンドン面白くなりますね😊 pic.twitter.com/Zbr4uQilOO

kinoharu｜40代からの変革｜学び直し・AI活用｜DATA Saber@kinoharu_k

5月19日(日) 7:46

メニューを開く

#統計「θ=0」型のゼロ仮説のP値だけではなく、「θ=a」(aは任意の数値)の型の一般の検定仮説のP値の話をしたいときの困難の1つは、主要な統計ソフトの仕様がそのようになっていない場合が多いことです。 2×2の分割表でのχ²検定の実装のあるべき仕様は以下の通り。 pic.twitter.com/2wywkdfB2z

黒木玄 Gen Kuroki@genkuroki5月9日(木) 3:46

#統計 2×2の分割表に関するχ²検定の実装のあるべき仕様は ①デフォルトでは連続性補正を一切適用しない。 ②オッズ比、リスク比、リスク差の信頼区間を計算してくれる。 ③オッズ比、リスク比、リスク差の値に関する検定仮説のP値を計算してくれる。 ④P値関数のグラフを作画してくれる。

黒木玄 Gen Kuroki@genkuroki

5月16日(木) 14:13

メニューを開く

#統計例えば、データの数値「n個中当たりはk個」に関する「当たりの確率はp=0.3」という仮説の(両側)二項検定については、P値について正確には説明できなくても、そのP値はデータの数値「n個中当たりはk個」と p=0.3の二項分布の相性の良さの指標の1つであると言えればそう悪くない。

黒木玄 Gen Kuroki@genkuroki

5月16日(木) 13:50

メニューを開く

#統計 P値の説明を正確にできるようになるためにはモデルの確率分布の中身を正確に理解する必要があります。しかし、多くの人にとってそれは困難です。次善の策として、P値がデータの数値とモデル+パラメータの値の設定の相性の良さの指標の1つであることを強調するという手があると思う。 pic.twitter.com/pSQhbq2HIZ

黒木玄 Gen Kuroki@genkuroki5月16日(木) 11:14

返信先:@shiraishia_md#統計 P値の無難な解釈について補足「検定仮説の下でのモデル内確率分布によって観察データ以上に極端な値が生成される確率(の近似値)」=P値は、使用しているモデルの下での(←この制限を忘れるとアウト) 検定仮説とデータの数値の相性の良さ(compatibility)の指標の1つだと解釈されます。

黒木玄 Gen Kuroki@genkuroki

5月16日(木) 12:19

メニューを開く

#統計検定法の定式化には、 ①P値 ②棄却領域 ③棄却確率を与える検定関数の3種類の方法がありますが、統計学入門の講義では「①P値」を採用し、学生を悪しき二分法に誘導しないように配慮するべきだと思います。特に②は悪しき二分法に誘導しがちだし、③と違って理論的にも中途半端です。

黒木玄 Gen Kuroki@genkuroki

5月16日(木) 12:01

メニューを開く

返信先:@shiraishia_md#統計 P値は点推定だけではなく、区間推定の方法も与えます。「リスク比はaである」の(両側)P値がα以上になるaの範囲は、リスク比に関する信頼水準1-αの信頼区間になります。以上のP値の使い方についてはGreenlandさん達がずっと解説して来てくれています。P値は推定の道具として使うべきです。

黒木玄 Gen Kuroki@genkuroki

5月16日(木) 11:24

メニューを開く

返信先:@shiraishia_md#統計「リスク比は1.6である」という検定仮説のP値が13%ならば、使用しているモデルの下で「リスク比は1.6である」という仮説とデータの数値は相性は悪くないのように解釈できます。「リスク比は2.5である」のP値が1の場合には、2.5はリスク比の点推定値になります。続く

黒木玄 Gen Kuroki@genkuroki

5月16日(木) 11:21

メニューを開く

返信先:@shiraishia_md#統計例えば「リスク比は1である」というゼロ仮説のP値が0.1%ならば、使用しているモデルの下で「リスク比は1である」というゼロ仮説とデータの数値は相性が非常に悪いと通常判断します。続く

黒木玄 Gen Kuroki@genkuroki

5月16日(木) 11:18

メニューを開く

黒木玄 Gen Kuroki@genkuroki

5月16日(木) 11:14

メニューを開く

返信先:@shiraishia_md#統計補足。帰無仮説という言い方を廃して説明し直すと、大雑把にP値は検定仮説の下でのモデル内確率分布によって観察データ以上に極端な値が生成される確率(の近似値) だと説明できます。検定仮説の典型例は「リスク比は2.34である」(その場合のゼロ仮説は「リスク比は1である」)の類です。

黒木玄 Gen Kuroki@genkuroki5月16日(木) 0:10

#統計 P値は帰無仮説下のモデル内確率分布によって観察データの数値以上に極端な値が生成される確率(の近似値) だとよく説明されます。ただしこの言い方だと「～以上に極端な値」の意味が曖昧になるので、この説明はかなり大雑把です。

黒木玄 Gen Kuroki@genkuroki

5月16日(木) 11:10

メニューを開く

「美女アイコンの中身はおっさんでない」という帰無仮説を立てると、p値1%でもゆうゆう棄却されます。

ペレック（perec）@quinceinkar5月15日(水) 15:51

返信先:@Canary_Kunいまどきの若い女の子、禿同とか使わなくないですか…

ケビン松永@Canary_Kun

5月15日(水) 16:01

メニューを開く

振子時計の論考なんだけど，振子はQ値(振子が持つエネルギー/1周期で失うエネルギー)だけではなくP値(1周期で失うエネルギー/脱進機が振子に与えるエネルギーの変動)も重要なのではないかというお話．正確な時計を作るためにはQだけではなくP×Qを大きくする必要があると． leapsecond.com/hsn2006/pendul…

けいけい 🇻🇳@Kei_Kei_Twi

5月15日(水) 1:20

メニューを開く

P値は、0から1までの範囲の値を取ります。

デザワーク＠あなただけのキャリアをデザイン@mokonokoi1nnt1

5月14日(火) 16:40

メニューを開く

返信先:@kamokita1P値は、現実における1回の実験観察で得られたデータの数値以上に極端な値に、帰無仮説下のモデル内確率分布で生成されたデータの数値がなる確率です。ただし、これは非常に大雑把な説明で、これを正しいP値の定義だと思ってしまうとまずい。このことも多種のP値の実装をやれば分かります。続く

黒木玄 Gen Kuroki@genkuroki

5月13日(月) 23:52

メニューを開く

ワクチン効果を見るために表１のage adjusted deathを 2020年を基準値として計算しました。 1. 2022年は2021年に比べて超過癌死亡(P値)が3倍に増加。 2. 脳腫瘍、白血病、女性の癌(乳がん、卵巣、子宮）の増加が顕著。そういえばこの前大学の先輩が白血病で亡くなった。 x.com/mbi92710920/st… pic.twitter.com/oAar3pXwLt

このメディアは、センシティブな内容を含んでいる可能性があるため表示されません。表示する

mbi@mbi927109205月13日(月) 2:06

ワクチン効果を見るために表１のage adjusted deathを2020年を基準値として計算しました。 1. 2022年は2021年に比べて超過癌死亡(P値)が3倍に増加。 2. 脳腫瘍、白血病、女性の癌(乳がん、卵巣、子宮）の増加が顕著。そういえばこの前大学の先輩が白血病で亡くなった。 ncbi.nlm.nih.gov/pmc/articles/P…

南びわ湖エリア情報🛳️@minamibiwako

5月13日(月) 16:03

メニューを開く

ESC-HF【MI後SGLT2-iが転帰に及ぼす影響はDM合併の有無に影響受けず：EMPACT-MI事前設定解析】 MI後HF高リスク3260例ランダム化、17.9ヶ月観察：SGLT2-i群の対プラセボ「総死亡・HF初回入院」HRはDM「非合併」例で0.76 [95%CI 0.53-1.09]、「合併」例も0.94 [0.73-1.21]。交互作用p値は0.41。

宇津貴史 /Utsu, Takashi@Office_j

#統計個人的な意見では、「第1種の過誤の確率」やら「検出力」のような専門用語を覚えることよりも、　各種の状況でP値の確率分布の形がどのように変わるかについて理解している方がずっと重要だと思います。「第1種の過誤の確率」やら「検出力」の話はそこに含まれます。

黒木玄 Gen Kuroki@genkuroki

5月11日(土) 11:45

メニューを開く

#統計「P値がα以下になる確率のグラフ」を色々書いてみることは、P値の概念を理解するために非常に役に立ちます。帰無仮説下のモデルの確率分布で標本をランダムに生成している場合には第1種の過誤の確率のグラフになる。対立仮説下のモデルの場合には検出力のグラフになる。

黒木玄 Gen Kuroki@genkuroki

5月11日(土) 11:43

メニューを開く

最近、回帰分析について最近知った重要なこと。 1. 変数選択の基準にp値を使うのは明確に誤り。AIC、BIC、Cp、調整済みR^2、交差検証などを用いる。 2. ステップワイズも悪くない。

ry_ts@ry_tsurumi

5月11日(土) 1:24

メニューを開く

#統計 Rのfisher.testについてはその欠点を修正したexact2x2パッケージがある。 exact2x2でのFisher検定の仕様 ①minlikやcentralなど複数のP値の定義を使用可能。 ②オッズ比の信頼区間を計算してくれる。 ③オッズ比を任意の値に設定する検定仮説のP値も計算可能。 ④P値関数も作画可能。

黒木玄 Gen Kuroki@genkuroki2022年2月22日

#統計そういう効率の悪い計算法を甘受し、精度を落とす犠牲を払って、広めになる信頼区間の定義を #R言語のfisher.testは採用しています。その辺を訂正したのが、library(exact2x2)のexacr2x2函数だとみなせます。

黒木玄 Gen Kuroki@genkuroki

5月9日(木) 4:02

メニューを開く

黒木玄 Gen Kuroki@genkuroki5月9日(木) 3:37

返信先:@Iguchi_YRのchisq.testでの2×2の分割表の取り扱いでは ❌デフォルトでYatesの連続補正をするという仕様も問題だし、 ❌オッズ比、リスク比、リスク差の信頼区間を計算してくれないのも問題でちょっと実用的ではない感じ。誰かまともなχ²検定のパッケージを作って欲しい。すでにあるなら教えて欲しい。

黒木玄 Gen Kuroki@genkuroki

5月9日(木) 3:46

メニューを開く

返信先:@rakuslckita残念ながら「曲線下面積が1」にはなりません。P値関数は確率密度関数ではないです。事後分布の確率密度関数のグラフでは「曲線下面積が1」にはなります。実際にP値関数のグラフと事後分布の確率密度関数のグラフをコンピュータで描くと楽しめると思います。

黒木玄 Gen Kuroki@genkuroki

5月8日(水) 10:36

メニューを開く

返信先:@genkuroki効果はaである仮説のp値、効果はa'である仮説のp値、と際限なく計算しつづけ、縦軸にp値、横軸を効果量として、曲線下面積が1になる曲線をひいてあげて…あ、これはアレだ…

脂身@rakuslckita

5月8日(水) 10:27

メニューを開く

返信先:@ueafam他1人よく誤解されていることですが、有意確率p値は標本が棄却域に入っているかどうかを調べるための便宜的な値にすぎません。 1/3 snap-tck.com/room04/c01/sta… pic.twitter.com/TzKHeFRktz

とものり@snap_tck

5月7日(火) 15:06

メニューを開く

仮にp値を帰無仮説が正しい確率とみなすなら1-(p値)は対立仮説が正しい確率とみなすことができるはずだが、95%の確率で効果があるとは誰も言わないのでなんとなくこれだけで違うことがわかるような気がする

中央フリーウェイ@Central_Freeway

5月6日(月) 18:48

メニューを開く

細かいところで分からないところはまだあるのだけれど、 1. modified poissonでsandwich分散の方が標準誤差が小さくなるのとはどんなときなのか？ 2. sandwich分散を使ったときのP値をどう計算するのか？が特に大きな未解決ポイントデス。

ironman@hommedefer35月6日(月) 10:23

サンドイッチ分散の計算を実装する編も書きました。大体合っているけれど、まだズレることがあります。。。 Modified Poissonを理解する - PART2 実装編｜ironman zenn.dev/ironman/articl… #zenn

ironman@hommedefer3

5月6日(月) 15:10

メニューを開く

f. 抗菌薬Aと抗菌薬Bは母集団の入院期間の平均に与える影響が等しい(つまりAは入院期間の平均を短縮も延長もしない)と仮定したときに、A群とB群の入院期間に1.5日かそれ以上の差がまぐれで出る確率は3.6%である。 ↑正しい正しい選択肢作るの難しい。これだからp値は使いにくい。効果量書け。

音風景の管理人@kamedo2

5月6日(月) 13:40

メニューを開く

持続的回復、早期の持続的回復、すべての症状の軽減、および持続的軽減のp 値はすべて < 0.0001 です。イベルメクチン群の患者も1年後には健康状態が著しく改善した。12 か月時点でのイベルメクチンによる中程度/重度の症状を組み合わせた低い方のp 値は< 0.0000001 です。 #イベルメクチン

kkkkkkk@kkkkkkk777

5月5日(日) 20:00

メニューを開く

#統計 P値について理解したい人は以下を読むと良いと思います。佐藤俊哉著『宇宙怪人しまりす統計よりも重要なことを学ぶ』の第1話 asakura.co.jp/detail.php?boo… 『ロスマンの疫学第2版』の第8章 shinoharashinsha.co.jp/Books2.aspx?PI… Greenlandさんの講演スライド biostat.ucdavis.edu/sites/g/files/…

黒木玄 Gen Kuroki@genkuroki

5月4日(土) 21:10

メニューを開く

#統計無数のP値を「データの数値とモデル+パラメータの値の設定の相性の良さの様子」を見るために使うことは、『ロスマンの疫学第2版』のような教科書に書かれています(添付画像)。この場合のP値はモデルのパラメータとしての相対リスクの値と表8-1のデータの数値の相性の良さを意味する。 pic.twitter.com/h5MLiQMpRJ