- すべて
- 画像・動画
並べ替え:新着順
この例の母集団分布(帰無仮説 (Sharp Null)分布)は 1, 4, 3, 2, 1, 1, 3, 4, 1, 0, 2, 1, 2, 1, 4, 1, 3, 2, 3, 1 である。それを2つの群へランダム割当するシミュレーションを 100 万回とか試行して、平均値の群間差 (MD) をプロットすれば確率分布(尤度分布)ができあがり正確なP値を算出できる pic.twitter.com/Jt4Ti6E3Ji
#統計 以下のリンク先の証明は本質的に、 (信頼水準1-αの信頼区間) = { a | (仮説θ=aのP値)≥α } のとき、 (信頼区間の被覆確率) = 1 - (P値のαエラー率) が成立していることを示しています。 信頼区間の被覆確率に感する説明は本質的にP値のαエラー率に関する説明と同じだということになります。 x.com/genkuroki/stat…
#統計 証明 (C0) ⇔ (a∈(信頼水準1-αの信頼区間)となる確率) ≈ 1-α ⇔ ((仮説θ=aのP値)≥αとなる確率) ≈ 1-α ⇔ ((仮説θ=aのP値)<αとなる確率) ≈ α ⇔ (P0) q.e.d.
#統計 脱線しまくった。 P値について教えるときには、「違いはない」型のゼロ仮説単独の1つのP値のみを見せるのではなく、常に「違いはaである」の型の仮説達の無数のP値を見せるようにしたいものだと思います。 ゼロ仮説への異様なこだわりはnullismという名の病気の症状の1つです。「有意差病」 x.com/genkuroki/stat…
#統計 色々言っていますが、個人的にP値の解説において最も優先するべきだと思っていることは、ゼロ仮説θ=0のP値だけではなく、一般の仮説θ=a (aは任意の数値)のP値全体を考えること。 これは「もう〇〇はやめよう」(例「統計的有意と言うのはやめよう」)の型の提案と違ってプラス面しかない。
#統計 母比率の「違い」では 「違い」の測り方が複数あること に触れざるを得ない。例えば、2つの母比率をp, qと書くとき、「違い」を測る指標として以下を選べる: * 差p - q * 比p/q * オッズ比 (p/(1-p))/(q/(1-q)) 現実の統計ソフトではゼロ仮説p=qのP値しか実装されていないことが多い。 x.com/genkuroki/stat…
#統計 2×2の分割表に関するχ²検定の実装のあるべき仕様は ①デフォルトでは連続性補正を一切適用しない。 ②オッズ比、リスク比、リスク差の信頼区間を計算してくれる。 ③オッズ比、リスク比、リスク差の値に関する検定仮説のP値を計算してくれる。 ④P値関数のグラフを作画してくれる。 x.com/genkuroki/stat…
「平均値の群間差 (MD, SMD)」のP値を算出するには、t検定類は不要。中心極限定理の挙動を確認するためのシミュレーションを、疫学調査の実践現場でも同様に試行すれば良いだけ。この真実に、歴史上の生物統計学者や疫学者は1人も気づくことができなかった。 pic.twitter.com/hZQU33skA2
🇮🇱 endotoxin💉⇒腸管から隣接する腸管腔へ脱出⇒腸重積⇒腸閉塞で手術必要に geoffpain.substack.com/p/intusseption… 🇮🇳 content.iospress.com/articles/inter… 腸重積の平均年齢が接種者205日で未接種者223日より僅か⬇️p値0.0026 接種後30日は次30日より腸重積⬆️92 対 63 p値0.009 未接種除外⇒3回目接種1~21日でrisk⬆️IRR2.47 pic.twitter.com/oUbOdDd0Yw x.com/sdgisan/status…
返信先:@funasejuku他1人母子手帳は日本弱体化ツール😡 この30年で乳幼児ワクチン激増😳 左 30年前:6種類 14回 右 現在: 14種類 36回 (ちなみに60年前も6種類) 本当に打った方がいいワクチンは🤔 #お母さんが未来を救う pic.twitter.com/1a35wY4Thd
それだと「尤度は尤もらしさを意味してない」と力説してたのと矛盾する。 『例えば、P値が最大の1になるモデルのパラメータの値すなわちデータの数値と最も相性が良いモデルのパラメータの値はは点推定値だと解釈されます。』 [x.com/genkuroki/stat…]
返信先:@toshizumi1225もし帰無仮説が「F(標本からのエフ)=1」(σ̂₁²=σ̂₂²)ですと例えばσ̂₁²=6,σ̂₂²=2なら(F分布やp値などをもちださなくても)F=6/2=3≠1よりこの帰無仮説が即時に("統計的な"検定をせずに)棄却されてしまいますよね
#統計 「P値<α」に関わるしんどい説明は後回しにして、 データの数値とモデル+パラメータの値の設定の相性の良さの指標の1つ という安全なP値の解釈を先に説明してしまい、P値の解釈をはっきりさせておいた方が私は良いと思います。 そうすればASA声明準拠及びGreenland準拠になります。安全牌! x.com/genkuroki/stat…
#統計 データの数値とモデル(+パラメータの値の設定)の相性の良さ(compatibility)の指標の1つ というP値の解釈の仕方は、Sander Greenlandさん達が繰り返し論文を書いて普及させようとしている解釈でもあります。ASA声明の原則1にあるP値の解釈はそれと本質的に同じ。
#統計 チェック項目1: P値が特定の統計モデルに依存して決まる値であることを強調しているか? ASA声明には「特定の統計モデルの下でデータの統計的要約値が観察された値以上に極端な値を取る確率」と、「特定の統計モデルの下に」と書いてあります。続く ASA声明 scholar.google.co.jp/scholar?cluste… より ↓ pic.twitter.com/UJJZq98DTV
#統計 再度強調 P値とは何かについて (1) P値はデータの数値以上に極端な値がモデルの確率分布で生成される確率である という説明はできても、P値の解釈について、ASA声明にある (2) P値はデータの数値とモデルの相性の良さの程度を表す という説明を無視すると、誤解誘導的な解説になり易い。 x.com/genkuroki/stat…
#統計 P値についての適切な解説が出て来難い理由は、ASA声明 scholar.google.co.jp/scholar?cluste… の2の「P値とは何か?」とほぼ同じ説明はできるが、3の原則の1に書いてあるP値の解釈の仕方を無視する人が多いからだと思う。 P値の誤解は解釈で起こり易いので、原則の1を無視すると誤解誘導的な解説になりがち。 pic.twitter.com/On0Q4nbi7w
両側は、2.5以上または―2.5以下になるので mean(res >= 2.5) + mean(res <= -2.5) [1] 0.0143 1.4%程度となります。これが両側P値となります。 要するに、「両群間で差がない」ことが真だった場合でも1.4%くらい起こるという事ですね。 pic.twitter.com/18gsQSJXpx
ここで「両群間で差がない」を帰無仮説として、帰無仮説が正しい場合に2.5またはそれより極端な観測値になる確率を求めてみましょう。 mean(res >= 2.5) [1] 0.0066 0.66%くらいですね。これが片側P値になります。 pic.twitter.com/25fKq3iJoF
ADA【SGLT2-i併用がGLP-1-RAの新腎保護作用に与える影響は?FLOW追加解析/ Nat Med】 RAS-i服用下の高リスクCKD合併2型DM 3533例ランダム化データ解析:SGLT2-i併用群 [550例] ではGLP-1-RA群対プラセボ心腎イベントHRが1.07 [95%CI:0.69-1.67]も、併用有無による交互作用p値は0.19。
ブッカーおじさんがアリならブラントン艦長もいけるっしょということで あー!予想はしてたよ。悪魔のドリンクその2。そして論理的帰結。 プレミアムバーボンとコアップはベータ値1.0の共依存関係(p値=0.01) んまい(● ˃̶͈̀ロ˂̶͈́)੭ꠥ⁾⁾ pic.twitter.com/2CeinWxYxI
H0: 所有率は、Xでの調査結果と同じ H1: 所有率は、Xでの調査結果と違う 有意⽔準α=0.05 p値は有意水準0.05より大きい、帰無仮説は採択される 従って、実際所有率はXでの調査結果と同じだと言える pic.twitter.com/xLb0VARjTb
#統計 ただし、それらの文献はどれも、閾値α(=有意水準=1-信頼水準)が固定された状況での、棄却領域と信頼領域の表裏一体性を扱っていて、閾値を全部動かして情報量を増やしたP値関数の概念に到達できていません。 有意水準もモデルのパラメータも全部動かし切らないと情報が減ってしまう。 x.com/genkuroki/stat…
#統計 このように、 すべての有意水準と「効果はaである」型のすべての仮説についてそれが仮説検定で棄却されるか否か の情報を含む P値関数(P-value function) を考えることは、Pearson (1955)の立場からも自然に出て来ることになる。 P値関数は推定の道具にもなる。 Greenlandさんの主張 ↓ x.com/genkuroki/stat…
返信先:@shunimajiware14回ガチャを引いてみて燈ちゃんが出ないと言う確率は5%以下なので、それは偶然に起こりうるとは考えづらく、何かしらの原因(≒有意差)がある(例えば運営によって燈ちゃんの数だけ少なくされている)と判断できる、というものです。 分野によって、その値(p値)が異なるので、1%とすると22回ですね
返信先:@BirthdayMarだから?完全ランダムな時系列でも、25%の確率で2年連続で上昇するんで。統計的に有意とされるp値0.05を下回ろうとすれば、+1,2%の微増なんて5年連続上昇して初めて「上昇傾向がありそうだ」と言えるレベルなんだけど。もちろん+10%とかを超える大きな上昇があれば話は別だけど。
#統計 P値関数のグラフ(以下のリンク先の1つ上の投稿にある)と以下のリンク先のベイズ統計での事後分布のグラフを比較すれば、P値関数と事後分布はほぼ同じ使い方をできる道具なことがすぐに分かります。 「P値関数から全部出る」と教えることには、ベイズ統計との接続でも大きなメリットがあります。 x.com/genkuroki/stat…
#統計 以上を理解した人は、P値関数とベイズ統計の事後分布がほぼ同じように使えることを、数秒で学べます! 添付画像は、「20回中6回」というデータの数値から得られる平坦事前分布に関する事後分布のグラフです。使い方はP値関数とほぼ同じです。 nbviewer.org/github/genkuro… pic.twitter.com/GWvhnbLOlP
#統計 教科書がP値から信頼区間を出す流儀で書かれていないことの弊害の分かり易い例は、Rのfisher.testが表示するnull P値と信頼区間の組み合わせに整合性がないことです。 null P値 < 5% なのにORの95%信頼区間がnull値の1を含む場合が出て来ます。 こういうのは困りますよね。 解決策 ↓ x.com/genkuroki/stat…
#統計 1つ上の投稿のP値関数を使えば、Rのfisher.testが表示するnull P値と整合的な信頼区間を計算できます。 そうして欲しい人は多いと思います。 そうすることを実装したのがRのexacr2x2パッケージです。 x.com/genkuroki/stat…
#統計 信頼区間をP値から出す流儀には、数学的にテクニカルな話の簡略化にも役に立ちます。 信頼区間の構成では両端の値を与える2つの関数を作る必要があるのですが、P値の構成であれば関数を1つ作るだけなので、相対的にP値の構成の方が楽になります。 P値から信頼区間を出すと納得感も増します。 x.com/genkuroki/stat…
#統計 統計学入門の教科書の伝統的スタイルでは推定の章と検定の章が分離されており、多くの場合にそれらの双対性の説明はない。P値の説明がなくて、棄却領域で説明していることが多い。 しかし、実際には、「P値(関数)から点推定、区間推定、仮説検定が全部出て来る」のスタイルに単純化可能。 pic.twitter.com/4hbQdSvumD x.com/genkuroki/stat…
P値に基づく仮説検定での棄却の考え方。その帰無仮説線を③へ変換すると、想定外すぎる形状というほどでもない。①で見ても、事象発現が、序盤でグレー群が少なすぎる代わりに、オレンジ群が 2 day 頃から多めに見えるので。重要なのは帰無仮説線の方。