自動更新

並べ替え:新着順

ベストポスト
メニューを開く

#統計 P値の説明を正確にできるようになるためにはモデルの確率分布の中身を正確に理解する必要があります。しかし、多くの人にとってそれは困難です。 次善の策として、P値が データの数値と モデル+パラメータの値の設定 の相性の良さの指標の1つ であることを強調するという手があると思う。 pic.twitter.com/pSQhbq2HIZ

黒木玄 Gen Kuroki@genkuroki

返信先:@shiraishia_md#統計 P値の無難な解釈について補足 「検定仮説の下でのモデル内確率分布によって観察データ以上に極端な値が生成される確率(の近似値)」=P値は、 使用しているモデルの下での(←この制限を忘れるとアウト) 検定仮説とデータの数値の相性の良さ(compatibility)の指標 の1つだと解釈されます。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 「θ=0」型のゼロ仮説のP値だけではなく、「θ=a」(aは任意の数値)の型の一般の検定仮説のP値の話をしたいときの困難の1つは、主要な統計ソフトの仕様がそのようになっていない場合が多いことです。 2×2の分割表でのχ²検定の実装のあるべき仕様は以下の通り。 pic.twitter.com/2wywkdfB2z

黒木玄 Gen Kuroki@genkuroki

#統計 2×2の分割表に関するχ²検定の実装のあるべき仕様は ①デフォルトでは連続性補正を一切適用しない。 ②オッズ比、リスク比、リスク差の信頼区間を計算してくれる。 ③オッズ比、リスク比、リスク差の値に関する検定仮説のP値を計算してくれる。 ④P値関数のグラフを作画してくれる。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 例えば、データの数値「n個中当たりはk個」に関する「当たりの確率はp=0.3」という仮説の(両側)二項検定については、P値について正確には説明できなくても、 そのP値は データの数値「n個中当たりはk個」 と p=0.3の二項分布 の相性の良さの指標の1つである と言えればそう悪くない。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 検定法の定式化には、 ①P値 ②棄却領域 ③棄却確率を与える検定関数 の3種類の方法がありますが、統計学入門の講義では「①P値」を採用し、学生を悪しき二分法に誘導しないように配慮するべきだと思います。 特に②は悪しき二分法に誘導しがちだし、③と違って理論的にも中途半端です。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

返信先:@shiraishia_md#統計 P値は点推定だけではなく、区間推定の方法も与えます。 「リスク比はaである」の(両側)P値がα以上になるaの範囲は、リスク比に関する信頼水準1-αの信頼区間になります。 以上のP値の使い方についてはGreenlandさん達がずっと解説して来てくれています。P値は推定の道具として使うべきです。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

返信先:@shiraishia_md#統計 「リスク比は1.6である」という検定仮説のP値が13%ならば、使用しているモデルの下で「リスク比は1.6である」という仮説とデータの数値は相性は悪くないのように解釈できます。 「リスク比は2.5である」のP値1の場合には、2.5はリスク比の点推定値になります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

返信先:@shiraishia_md#統計 例えば「リスク比は1である」というゼロ仮説のP値が0.1%ならば、使用しているモデルの下で「リスク比は1である」というゼロ仮説とデータの数値は相性が非常に悪いと通常判断します。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

返信先:@shiraishia_md#統計 P値の無難な解釈について補足 「検定仮説の下でのモデル内確率分布によって観察データ以上に極端な値が生成される確率(の近似値)」=P値は、 使用しているモデルの下での(←この制限を忘れるとアウト) 検定仮説とデータの数値の相性の良さ(compatibility)の指標 の1つだと解釈されます。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

返信先:@shiraishia_md#統計 補足。帰無仮説という言い方を廃して説明し直すと、大雑把にP値は 検定仮説の下でのモデル内確率分布によって観察データ以上に極端な値が生成される確率(の近似値) だと説明できます。 検定仮説の典型例は「リスク比は2.34である」(その場合のゼロ仮説は「リスク比は1である」)の類です。

黒木玄 Gen Kuroki@genkuroki

#統計 P値は 帰無仮説下のモデル内確率分布によって観察データの数値以上に極端な値が生成される確率(の近似値) だとよく説明されます。ただしこの言い方だと「~以上に極端な値」の意味が曖昧になるので、この説明はかなり大雑把です。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

「美女アイコンの中身はおっさんでない」 という帰無仮説を立てると、p値1%でもゆうゆう棄却されます。

ペレック(perec)@quinceinkar

返信先:@Canary_Kunいまどきの若い女の子、禿同とか使わなくないですか…

ケビン松永@Canary_Kun

メニューを開く

振子時計の論考なんだけど,振子はQ値(振子が持つエネルギー/1周期で失うエネルギー)だけではなくP値(1周期で失うエネルギー/脱進機が振子に与えるエネルギーの変動)も重要なのではないかというお話. 正確な時計を作るためにはQだけではなくP×Qを大きくする必要があると. leapsecond.com/hsn2006/pendul…

けいけい 🇻🇳@Kei_Kei_Twi

メニューを開く

P値は、0から1までの範囲の値を取ります。

デザワーク@あなただけのキャリアをデザイン@mokonokoi1nnt1

メニューを開く

返信先:@kamokita1P値は、現実における1回の実験観察で得られたデータの数値以上に極端な値に、帰無仮説下のモデル内確率分布で生成されたデータの数値がなる確率です。 ただし、これは非常に大雑把な説明で、これを正しいP値の定義だと思ってしまうとまずい。このことも多種のP値の実装をやれば分かります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

ワクチン効果を見るために 表のage adjusted deathを 2020年を基準値として計算しました。 1. 2022年は2021年に比べて 超過癌死亡(P値)が3倍に増加。 2. 脳腫瘍、白血病、女性の癌(乳がん、卵巣、子宮)の増加が顕著。 そういえばこの前大学の先輩が白血病で亡くなった。 x.com/mbi92710920/st… pic.twitter.com/oAar3pXwLt

mbi@mbi92710920

ワクチン効果を見るために表1のage adjusted deathを2020年を基準値として計算しました。 1. 2022年は2021年に比べて超過癌死亡(P値)が3倍に増加。 2. 脳腫瘍、白血病、女性の癌(乳がん、卵巣、子宮)の増加が顕著。 そういえばこの前大学の先輩が白血病で亡くなった。 ncbi.nlm.nih.gov/pmc/articles/P…

南びわ湖エリア情報🛳️@minamibiwako

メニューを開く

ESC-HF【MI後SGLT2-iが転帰に及ぼす影響はDM合併の有無に影響受けず:EMPACT-MI事前設定解析】 MI後HF高リスク3260例ランダム化、17.9ヶ月観察:SGLT2-i群の対プラセボ「総死亡・HF初回入院」HRはDM「非合併」例で0.76 [95%CI 0.53-1.09]、「合併」例も0.94 [0.73-1.21]。交互作用p値は0.41。

宇津 貴史 /Utsu, Takashi@Office_j

メニューを開く

ワクチン効果を見るために表のage adjusted deathを2020年を基準値として計算しました。 1. 2022年は2021年に比べて超過癌死亡(P値)が3倍に増加。 2. 脳腫瘍、白血病、女性の癌(乳がん、卵巣、子宮)の増加が顕著。 そういえばこの前大学の先輩が白血病で亡くなった。 ncbi.nlm.nih.gov/pmc/articles/P… pic.twitter.com/jfKLf1QzNy

メニューを開く

#統計 個人的な意見では、「第1種の過誤の確率」やら「検出力」のような専門用語を覚えることよりも、  各種の状況でP値の確率分布の形がどのように変わるか について理解している方がずっと重要だと思います。「第1種の過誤の確率」やら「検出力」の話はそこに含まれます。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計P値がα以下になる確率のグラフ」を色々書いてみることは、P値の概念を理解するために非常に役に立ちます。 帰無仮説下のモデルの確率分布で標本をランダムに生成している場合には第1種の過誤の確率のグラフになる。 対立仮説下のモデルの場合には検出力のグラフになる。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

最近、回帰分析について最近知った重要なこと。 1. 変数選択の基準にp値を使うのは明確に誤り。AIC、BIC、Cp、調整済みR^2、交差検証などを用いる。 2. ステップワイズも悪くない。

メニューを開く

#統計 Rのfisher.testについてはその欠点を修正したexact2x2パッケージがある。 exact2x2でのFisher検定の仕様 minlikやcentralなど複数のP値の定義を使用可能。 ②オッズ比の信頼区間を計算してくれる。 ③オッズ比を任意の値に設定する検定仮説のP値も計算可能。 ④P値関数も作画可能。

黒木玄 Gen Kuroki@genkuroki

#統計 そういう効率の悪い計算法を甘受し、精度を落とす犠牲を払って、広めになる信頼区間の定義を #R言語 のfisher.testは採用しています。 その辺を訂正したのが、library(exact2x2)のexacr2x2函数だとみなせます。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 2×2の分割表に関するχ²検定の実装のあるべき仕様は デフォルトでは連続性補正を一切適用しない。 ②オッズ比、リスク比、リスク差の信頼区間を計算してくれる。 ③オッズ比、リスク比、リスク差の値に関する検定仮説のP値を計算してくれる。 ④P値関数のグラフを作画してくれる。

黒木玄 Gen Kuroki@genkuroki

返信先:@Iguchi_YRのchisq.testでの2×2の分割表の取り扱いでは ❌デフォルトでYatesの連続補正をする という仕様も問題だし、 ❌オッズ比、リスク比、リスク差の信頼区間を計算してくれない のも問題でちょっと実用的ではない感じ。 誰かまともなχ²検定のパッケージを作って欲しい。すでにあるなら教えて欲しい。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

返信先:@rakuslckita残念ながら「曲線下面積が1」にはなりません。P値関数は確率密度関数ではないです。 事後分布の確率密度関数のグラフでは「曲線下面積が1」にはなります。 実際にP値関数のグラフと事後分布の確率密度関数のグラフをコンピュータで描くと楽しめると思います。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

返信先:@genkuroki効果はaである仮説のp値、効果はa'である仮説のp値、と際限なく計算しつづけ、縦軸にp値、横軸を効果量として、曲線下面積が1になる曲線をひいてあげて…あ、これはアレだ…

メニューを開く

返信先:@ueafam1よく誤解されていることですが、有意確率p値は標本が棄却域に入っているかどうかを調べるための便宜的な値にすぎません。 1/3 snap-tck.com/room04/c01/sta… pic.twitter.com/TzKHeFRktz

とものり@snap_tck

メニューを開く

仮にp値を帰無仮説が正しい確率とみなすなら1-(p値)は対立仮説が正しい確率とみなすことができるはずだが、95%の確率で効果があるとは誰も言わないのでなんとなくこれだけで違うことがわかるような気がする

中央フリーウェイ@Central_Freeway

メニューを開く

細かいところで分からないところはまだあるのだけれど、 1. modified poissonでsandwich分散の方が標準誤差が小さくなるのとはどんなときなのか? 2. sandwich分散を使ったときのP値をどう計算するのか? が特に大きな未解決ポイントデス。

ironman@hommedefer3

サンドイッチ分散の計算を実装する編も書きました。大体合っているけれど、まだズレることがあります。。。 Modified Poissonを理解する - PART2 実装編|ironman zenn.dev/ironman/articl… #zenn

メニューを開く

f. 抗菌薬Aと抗菌薬Bは母集団の入院期間の平均に与える影響が等しい(つまりAは入院期間の平均を短縮も延長もしない)と仮定したときに、A群とB群の入院期間に1.5日かそれ以上の差がまぐれで出る確率は3.6%である。 ↑正しい 正しい選択肢作るの難しい。これだからp値は使いにくい。効果量書け。

音風景の管理人@kamedo2

メニューを開く

持続的回復、早期の持続的回復、すべての症状の軽減、および持続的軽減のp はすべて < 0.0001 です。 イベルメクチン群の患者も1年後には健康状態が著しく改善した。12 か月時点でのイベルメクチンによる中程度/重度の症状を組み合わせた低い方のp は< 0.0000001 です。 #イベルメクチン

メニューを開く

#統計 P値について理解したい人は以下を読むと良いと思います。 佐藤俊哉著『宇宙怪人しまりす統計よりも重要なことを学ぶ』の第1asakura.co.jp/detail.php?boo… 『ロスマンの疫学第2版』の第8章 shinoharashinsha.co.jp/Books2.aspx?PI… Greenlandさんの講演スライド biostat.ucdavis.edu/sites/g/files/…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 無数のP値を「データの数値とモデル+パラメータの値の設定の相性の良さの様子」を見るために使うことは、『ロスマンの疫学第2版』のような教科書に書かれています(添付画像)。 この場合のP値はモデルのパラメータとしての相対リスクの値と表8-1のデータの数値の相性の良さを意味する。 pic.twitter.com/h5MLiQMpRJ

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値の適切な使い方は、何度も繰り返し説明していますが、P値を データの数値とモデル(検定したい仮説も含む数学的設定の全体)の相性の良さ(compatibility)の指標の1つ だと解釈することです。そして、ゼロ仮説θ=0だけではなく、任意のaに関する検定仮説θ=aのP値全体を利用すること。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計P値は検定したい仮説だけを評価する指標ではない」という当たり前のことについても、柳川堯著『P値』は適切な説明をしていないと思いました。 P値は データの数値と検定したい仮説を含む数学的設定全体(モデル)の相性の良さ(compatibility)の指標の1つ だと解釈するようにすると便利です。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値が小さい場合には、検定したい仮説だけではなく、P値の計算に使われた数学的設定の全体(モデル全体)やデータの数値の取得法の妥当性も疑いの対象になるという当たり前の話は、『統計的有意性とP値に関するASA声明』での原則1でも強調されています。 biometrics.gr.jp/news/all/ASA.p… pic.twitter.com/a1IMaRDeYG

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 その結果、多くの統計学ユーザー達は、「効果がない」という仮説のP値が有意水準未満もしくは非常に小さいならば、「効果がない」という仮説を否定するための証拠の1つが得られたかのように誤解してしまいます。 疑うべき対象から、モデルが完全に抜け落ちてしまう。

黒木玄 Gen Kuroki@genkuroki

#統計 P値や信頼区間はデータの数値とモデル(統計分析で使った数学的仮定の全体)の相性の良さを表しているので、「パラメータθの値はaである」(例:リスク比は1である)のような検定仮説だけではなく、それ以外の数学的仮定の全体と関連します。 添付画像はGreenlandさんのスライドからの孫引きの翻訳

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 「処置群と対照群で有効になる真の確率は等しい」という帰無仮説の下で、表3.1のAのような分割表のデータの数値が得られる確率よりも、Bのような分割表のデータの数値が得られる確率はずっと小さくなります。 その確率の違いがP値の違いになっていると考えてよい。続く pic.twitter.com/RgiSLOrRfh

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 柳川堯著『P値』のp.22より 割合は等しいが標本サイズは違う2つの分割表のデータについて、片方のP値は36%でもう一方のP値1.4%であることについて 【矛盾した判定結果】 【サンプルサイズを無視してP値を有意水準5%で判定すると,このような誤用が起こる】 と説明するのは酷すぎ。続く pic.twitter.com/C3l3dpgpx7

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 広い信頼区間と大きめのP値はHRの点推定値が信頼できないことを意味しています。HRの点推定値が1から大きく離れた値になっていることを理由に、標本サイズを増やせばP値が5%を切る可能性が高いかのように考えることも間違っている。 添付画像に引用した部分はそのような誤解の原因になります。 pic.twitter.com/8iWx1pjUk9

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 添付画像は柳川堯著『P値』より HRの点推定値が1から大きく離れているという理由で【かなり強いリスクファクターだと示唆される】と考えることは誤りです。 なぜならば、小さな標本サイズでは、真のHRが1であっても、HRの点推定値が1から大きく離れる確率は大きくなるからです。続く pic.twitter.com/eFAy593pza

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 添付画像は柳川堯著『P値1.3節にある正規分布の密度函数のグラフ。σの長さがまるで2σになってしまっています。 添付画像②は正しいグラフです。 σと2σの区別は初学者向けの教科書では大事なのでもっとしっかりして欲しいです。 pic.twitter.com/vPe1pNKKbo

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値 ―その正しい理解と適用― (統計スポットライト・シリーズ) 2018/11/28 柳川 堯 (著) この本は良いことも書いてあるのですが、ほうちゃんさんも御指摘のようにつっこみ所が色々ある本だと思います。 添付画像は1.3節にあるグラフ。 問題:このグラフのどこがおかしいか? 続く pic.twitter.com/klgoahtT3t

ほうちゃん@houji13

『P値』という本で信頼区間の幅が信頼区間の上限の二倍だって書いてあって萎えるなぁって。

黒木玄 Gen Kuroki@genkuroki

トレンド6:45更新

  1. 1

    スポーツ

    カブス打線

    • 今永昇太
    • 7奪三振
    • メジャー
    • サヨナラ
  2. 2

    グルメ

    何が女性でしょうか

    • この方を私たち女性がうまずして
    • この方を私たち女性がうまずして何が女性でしょうか
    • 生まずして何が女性
    • この方を
    • 上川外相
    • 上川陽子外相
    • 上川陽子
    • 産まずして
    • 静岡県知事選
    • 静岡市葵区
    • 何が女性か
    • 外務大臣
    • 静岡県知事
    • 上川外務大臣
    • 文句言ってる
    • 自民党政治
    • 差別意識
    • 生まずして
  3. 3

    上川氏「うまずして何が女性か」 静岡知事選の応援演説で

    • うまずして何が女性
    • うまずして何が女性か
    • 女性の気持ち
    • 不適切な発言
    • 何が女性か
    • 発言しない
  4. 4

    スポーツ

    今永先生

    • 今永昇太
    • ムエンゴ
  5. 5

    白井義男

    • 昭和27年
    • 4階級制覇
    • 日本初の
    • ボクシング
    • 日本人初
    • 井上尚弥
  6. 6

    アニメ・ゲーム

    山吹沙綾

    • 綾ちゃん
  7. 7

    EF65-2074

    • EF65 2074
    • 小田急8000形
    • 西武鉄道
    • 甲種輸送
    • 8261f
    • 御殿場線
    • 小田急8000
    • EF65
    • 小田急線
    • 8000形
  8. 8

    スポーツ

    コルディナ

  9. 9

    出産の話

    • 静岡県知事選
  10. 10

    エンタメ

    高校生クイズ

    • 指原莉乃
    • かまいたち
    • SixTONES
20位まで見る

人気ポスト

電車遅延(在来線、私鉄、地下鉄)

遅延している路線はありません

全国の運行情報(Yahoo!路線情報)
よく使う路線を登録すると遅延情報をお知らせ Yahoo!リアルタイム検索アプリ
Yahoo!リアルタイム検索アプリ