- すべて
- 画像・動画
並べ替え:新着順
#統計 チェック項目1: P値が特定の統計モデルに依存して決まる値であることを強調しているか? ASA声明には「特定の統計モデルの下でデータの統計的要約値が観察された値以上に極端な値を取る確率」と、「特定の統計モデルの下に」と書いてあります。続く ASA声明 scholar.google.co.jp/scholar?cluste… より ↓ pic.twitter.com/UJJZq98DTV
両側は、2.5以上または―2.5以下になるので mean(res >= 2.5) + mean(res <= -2.5) [1] 0.0143 1.4%程度となります。これが両側P値となります。 要するに、「両群間で差がない」ことが真だった場合でも1.4%くらい起こるという事ですね。 pic.twitter.com/18gsQSJXpx
ここで「両群間で差がない」を帰無仮説として、帰無仮説が正しい場合に2.5またはそれより極端な観測値になる確率を求めてみましょう。 mean(res >= 2.5) [1] 0.0066 0.66%くらいですね。これが片側P値になります。 pic.twitter.com/25fKq3iJoF
ブッカーおじさんがアリならブラントン艦長もいけるっしょということで あー!予想はしてたよ。悪魔のドリンクその2。そして論理的帰結。 プレミアムバーボンとコアップはベータ値1.0の共依存関係(p値=0.01) んまい(● ˃̶͈̀ロ˂̶͈́)੭ꠥ⁾⁾ pic.twitter.com/2CeinWxYxI
H0: 所有率は、Xでの調査結果と同じ H1: 所有率は、Xでの調査結果と違う 有意⽔準α=0.05 p値は有意水準0.05より大きい、帰無仮説は採択される 従って、実際所有率はXでの調査結果と同じだと言える pic.twitter.com/xLb0VARjTb
乳児💉追加set→有害事象⬆️ ijvtpr.com/index.php/IJVT… 1991/7~2011/5 1,542,076種 DTaP,HIB,IPV接種227,231例 3種💉 DTaP+IPV+HIB基本💉のみより💉後≦30日:気管,気管支他疾患3,041%⬆️ 発達障害「発育不全」risk最高:RR4.662⬆️ 白血球⬆️基本💉+HepB-Rota💉RR99.663risk最高 科学精査最高基準p値<0.0001 pic.twitter.com/i0UBqLG45V x.com/DerMellitz/sta…
返信先:@Thomas_Binder🤮🎯That was years ago and today the number is probably much larger. I read the number 45 vaccinations, up to the end of the toddler age. (3 J.) pic.twitter.com/cCy6bTQBYN
#統計 ASA声明の原則の1のP値の解釈の仕方: P値は、観察データの数値と特定の統計モデルの相性の良さの程度を表す。 「相性の良さの程度」は"how compatible"の訳のつもり。原文では"incompatible"だが、P値大とcompatibility大が対応するので"compatible"に変更した。 pic.twitter.com/pr6b3heNic
#統計 P値についての適切な解説が出て来難い理由は、ASA声明 scholar.google.co.jp/scholar?cluste… の2の「P値とは何か?」とほぼ同じ説明はできるが、3の原則の1に書いてあるP値の解釈の仕方を無視する人が多いからだと思う。 P値の誤解は解釈で起こり易いので、原則の1を無視すると誤解誘導的な解説になりがち。 pic.twitter.com/On0Q4nbi7w
#統計 P値<αとなっただけで【帰無仮説は成立し難いと判断できる】とすることは誤りです。 ASA声明 scholar.google.co.jp/scholar?cluste… を読み直した方が良いと思いました。原則の1にP値の解釈の仕方が書いてあります。続く pic.twitter.com/8kRTAus1cj x.com/toshizumi1225/…
本日は5.1節と5.2節を扱いました。対応のないt検定を題材に、統計的検定の論理とエラー確率のコントロールについて確認しました。p値を実際に計算しました。 pic.twitter.com/kUNxHbDLkH
#統計 Wilsonの信頼区間に対応するP値なら以下のように言える(添付画像左下): ①二項分布Binomial(20, 0.25)は正規分布Normal(5, √3.75)で近似される。 ②P値はその正規分布において モデルの期待値20×0.25=5回から データの数値の9回以上に離れた値が 生成される確率 として計算される。 pic.twitter.com/3bysfbL2KQ
#統計 P値関数と事後分布のグラフの例を追加。 以下のリンク先のグラフは、線形回帰モデルy=β₀+β₁x+u, u~Normal(0,σ)におけるβ₁に関するP値関数と事後分布のグラフです。 (β₀, β₁, log σ²)に関する平坦事前分布によるベイズ版線形回帰の結果は通常の線形回帰にぴったり誤差無しに一致します。 pic.twitter.com/JFZTSqsaBS
#統計 #Julia言語 線形回帰のβ₁に関するP値関数 と βとlog σ²について平坦な事前分布での ベイズ版線形回帰のβ₁に関する事後分布 は数学的に「同等」なので、 線形回帰に関するP値を使う方法とベイズ法の違い は 事前分布の平坦分布との違い にちょうど対応。 github.com/genkuroki/publ…
#統計 データの数値「n回中k回当たり」に関する仮説「当たりが出る確率はpである」のP値の計算の仕方: ①「当たりが出る確率はpである」の設定の二項分布を考える。 ②その二項分布は期待値np、分散np(1-p)の正規分布で近似される。 ③P値=その正規分布でnpからk以上離れた値が生成される確率 pic.twitter.com/LWKkvpC7Ii
#統計 添付画像は、ルーレットを20回まわしたら当たりが5回出たというデータの数値に関する二項分布モデル+「当たりが出る確率はpである」という仮説のP値のグラフです。
#統計 仮にデータ取得前に決めておいた閾値α=0.05によって、P値がα以上なら相性が良い、α未満なら相性が悪いと2値的な判断をすることにしていたとする。 そのとき、p=1/2のP値は約0.025なので「当たりが出る確率は1/2」という仮説と「20回中5回」というデータの数値は相性が悪いと判断されます。 pic.twitter.com/Su9gyRb49c
#統計 ちょっと面白いのは、Lehmann, Testing Statistical Hypothesesの第1版ではP値をcritical level (臨界水準)と呼んでいたこと。 第2版で、significance probability (有意確率)、p-value (P値)と呼ぶようになった。 NP流なので "how ~ contradict"と「矛盾」という強い言葉を使う傾向がある。 pic.twitter.com/cwz7tjZT0G
#統計 Neyman-Pearson流の検定の定式化でのP値の定義の仕方については、Lehmann, Testing Statistical Hypotheses, 2nd edition, 1986のp.70を参照(添付画像1)。 1959年版ではp-valueとは呼んでなかった(添付画像2)。
#統計 Welchのt検定の導出で使われるt統計量の定義式の分母の2乗が従う分布のχ²分布の定数倍による近似は、正規母集団の仮定からの逸脱について脆弱で一般にはうまく行きません。 しかし、自由度がmin(m-1, n-1)以上になるお陰でm,nが十分大きいならP値レベルでは正規母集団の仮定からの逸脱に頑健。 pic.twitter.com/w2oKEYfRBm
#統計 Welchのt検定で使われる 正規母集団の仮定の下での(S_X)²/m+(S_Y)²/n の分布の自由度νのχ²分布のa倍による期待値と分散を揃える近似 は正規母集団の仮定からの逸脱に脆弱なのですが、使用するt分布の自由度はmin(m-1,n-1)以上になるので、m,nが大きいならP値のレベルでは頑健になります。
#統計 P値関数について biostat.ucdavis.edu/sites/g/files/… のスクショの添付画像にあるグラフが、P値関数のグラフです。高さαに信頼水準1-αの信頼区間の両端の点をプロットしても同じグラフが得られるので、P値関数は信頼区間関数と呼ばれることもあります。続く pic.twitter.com/AzbpoXxNED
#統計 P値が最大になるaの値は差の点推定値になります。 P値が推定の道具でもあることは論文 scholar.google.co.jp/scholar?cluste… Rafi-Greenland 2020 にも分かるように書いてあるし、Greenlandさんのスライドにもあります。 biostat.ucdavis.edu/sites/g/files/…
#統計 P値と尤度(ゆうど)のさらに違う部分の解説 データの数値をx=(x₁,…,xₙ)と1文字でまとめて書き、モデルのパラメータを(θ,η)と2つに分けて書くことにする。 このとき、確定したデータの数値xに関するモデルの尤度はp(x|θ,η)のように書けて、尤度は(θ,η)の関数になる。非常にシンプル。続く pic.twitter.com/bCtZWdsxsq
#統計 解説 P値は、データの数値__以上に極端な__値がモデルの確率分布で生成される確率またはその__近似値__。 尤度の定義は、データの数値__に等しい__値がモデルの確率分布で生成される確率またはその__密度__。 強調部分が違う(本当はさらに違う部分もあるが略)。混同する人が多い。続く
#統計 添付画像の p.1でP値と尤度(ゆうど)を混同 しており、 p.3ではP値と有意水準を混同 しています。 添付画像の2枚目は悪くないと思ったので、1枚目でP値に関する説明がまるっきり間違っている点が痛い。非常にもったいない。 続く pic.twitter.com/BumnTmaV76
長崎の盟友である佐藤さん(x.com/Shuntarooo3/st…)や中島さん(x.com/naka_takaya/st…)がP値の説明で界隈を盛り上げているので自分も今週にある弊学のシンポジウムでその話をしようと思ったら「ちゃんと先生の研究成果の話をしてください」とのことだったのでここに供養します
#統計 P値のトリセツ(⻑崎⼤学病院初期研修医1年⽬中島誉也)には添付画像のように書いてあります(手書き部分は私のコメント)。 【検定から推定へ】というスローガンは正しい。 しかし、P値も推定のための道具なので、そのスローガンがP値の欠点の話だとするのは誤り。 speakerdeck.com/taka88/pzhi-fa… pic.twitter.com/EvTCxhdhT8
#統計 おそらく、これが伝統的なP値や検定法に関する教え方が改善されない理由の1つ。 pic.twitter.com/BlGwoVigWh
検定のスライドについていろいろとご指摘を受けているようですが,ミュートしている方なので,平穏のために覗かないようにします. なので,わたしの反応がないことはご指摘に同意を示しているわけではないです.見ていないのが理由です.
#統計 P値は大きいほどcompatibleになる指標なので、原文も素直に"how compatible"とすれば分かり易かった。日本語では P値はデータの数値と統計モデルと検定したい仮説の組み合わせの相性の良さの程度を示す指標の1つである のように説明すればぴったりだと思います。 pic.twitter.com/dQWVaFl6od
#統計 ASA声明の原文は scholar.google.co.jp/scholar?cluste… 経由で読めます。その原則の1に原文は 1. P-values can indicate how incompatible the data are with a specified statistical model. です。incompatibleという単語の翻訳は難しい。佐藤俊哉さんはhow incompatibleを「矛盾する程度」と翻訳。続く
#統計 続き。しかし「矛盾する程度」の「矛盾する」は相当に強い響きを持つので、P値単体には大して力はないことを強調したい文書の翻訳では不適切だと私は思いました。 あと、P値は大きい方がよりcompatibleになるので、原則の1のhow incompatibleはhow compatibleとした方が良かったと思います。 pic.twitter.com/Y0XjduHMnm
#統計 P値は対数スケールで見た方が誤解が減るかもしれないという話もあります。S値 S値 = -log₂ P値 (単位はbit) とおいて、P値の違いの大きさは、S値の差の大きさで測ると良いです。 80%のP値と40%のP値の違いは1bitに過ぎず、8%のP値と4%のP値の1bitの違いに等しい。 biostat.ucdavis.edu/sites/g/files/… pic.twitter.com/9ui1NcUnFL
#統計 コインを20回投げたら5回表が出た状況で、「表が出る確率はp=1/2」という帰無仮説のP値はグラフから5%未満であることもわかります。 P値を2値的判断の道具とみなす不適切な説明ではそのような単独のP値しか使わない。 だから、ダメなのです。nullismという病気。 pic.twitter.com/PzsuKZq5Uj
#統計 P値を「有意差を出す」という2値的判断のための道具とみなさずに、Greenlandさんのように、推定の道具だとみなせば良いのです。P値は 背景となるモデルの下でのデータの数値とパラメータの値の相性の良さの指標の1つ なので、パラメータの値の推定に使えます。 biostat.ucdavis.edu/sites/g/files/… pic.twitter.com/PvybEJEzWO
各尤度にP値が付与されるので(帰無)仮説値の確率分布(尤度分布)が正規分布ならP値の分布は正規分布である。それの横軸とビン幅を人為的に変更すると平坦分布に見えるだけ。 尤度:観測値の棒グラフ1本。 P値:観測値 "以上" の大差(尤度分布の両外側)の累積値。 x.com/takekan/status… pic.twitter.com/c8NWrcZ7r9
無関係な2変数xとyにランダムな数値をわりあて、y=a+bxという回帰を勘違いに基づいて行います。それを10000回繰り返します。当然、多くの場合で係数bの推定値はゼロに近いものです。 p値も10000個計算します。p値の定義を思い出せば、その分布は[ 一様分布 ]となるはずですね。
「大雑把な例え話」としても、もっとマシな例え方があるだろうと思う。「観測値が真値である確率」や「1−P値=対立仮説が真値である確率」とか「もっともよくある誤解」として知られてる文章ほぼそのままではさすがにまずい。医師国家試験も薬剤師国家試験もP値を誤解してるが訂正されてない。 pic.twitter.com/SgI1jjWt7b
「p値」って何といわれて全く答えられない人に、計量経済入門の単位とか認定しちゃだめだよなあ、と思っている。 ざっくりいえば、p値(p-value)は「ある結論が、実はただの勘違いである可能性」と解釈できる。(小声でいうと、小さい方がうれしい) 例えば、学生グループAとBのテストの成績差。
#統計 P値は背景となるモデルの下でのデータの数値とパラメータの値の相性の良さの指標でした。 信頼水準1-αの信頼区間は「P値≥αとなるパラメータの値の範囲」なので、「閾値αの設定によってデータの数値と相性が良いと判定されたパラメータの範囲」だと解釈されます。 scholar.google.co.jp/scholar?cluste… pic.twitter.com/R7MVEZzoBO
#統計 私による P値はデータの数値とモデル+パラメータの値な設定の相性の良さ(整合性、適合度)の指標の1つである という説明は、「統計的有意性とP値に関するASA声明」の原則1でのP値の説明と本質的に同じものだとみなされます。 安全牌のASA声明準拠!😁 pic.twitter.com/5MaulAdrK9
#統計 統計学を教える仕事をする人は 統計的有意性とP値に関するASA声明 biometrics.gr.jp/news/all/ASA には目を通しておいた方が無難。 これを読めば、P値に関する実践的に十分な説明と解釈法が得られます。 ただし添付画像への追記部分に注意することも必要。
#統計 P値について解説している最新の宇宙怪人しまりす本の第1話のタイトルは「背後仮定も含めて解釈することが重要なんですね」です。 背後仮定は数学的にはパラメータ付き確率分布によるモデルとして実装されています。P値を使う場合にはモデル全体を見ないとダメ。 asakura.tameshiyo.me/9784254122978?… pic.twitter.com/GwYkRxVI4Q
#統計 ①のリンク2/2 佐藤俊哉さんの講義動画 youtu.be/vz9cZnB1d1c?si… 仮説検定とP値の誤解 この動画は素晴らしいです。内容も素晴らしいですが,非常に聴きやすい点も驚異的だと思いました。自分の講義を録画したことがある人の多くはそう感じると思います。いやあ、これは本当にすごい。
#統計 「統計的有意性とP値に関するASA声明」の翻訳者の佐藤俊哉先生による素晴らしい講義動画もよく紹介されています。これも統計学を教える仕事をする人は視聴しておいた方がよい。教科書に誤りが書いてあることを明瞭に説明している。教科書通りに講義をしてはいけない。 youtu.be/vz9cZnB1d1c?si…
#統計 ①のリンク1/2 統計的有意性とP値に関するASA声明 biometrics.gr.jp/news/all/ASA 注意するべき点の修正版(観されたデータの数値→観測されたデータの数値) ↓ pic.twitter.com/beoJpblsVc
#統計 統計学を教える仕事をする人は 統計的有意性とP値に関するASA声明 biometrics.gr.jp/news/all/ASA には目を通しておいた方が無難。 これを読めば、P値に関する実践的に十分な説明と解釈法が得られます。 ただし添付画像への追記部分に注意することも必要。
返信先:@con_advancing#統計 私はP値に関する説明(定義ではない)を一言で「データの数値とモデル+パラメータの値の設定の相性の良さの指標の1つ」だと説明しています。 さらに元の説明と同様に具体例を使ってその内容を説明しています。 添付画像に引用した私へのコメントは私への不当な非難にすぎないと思いました。 pic.twitter.com/6CGR4fpH1A
返信先:@genkuroki先のポストは初学者に向けて一言二言で説明することを試みていました。一般には簡単に説明するほど正確ではなくなります。それに対して、間違いの指摘はできるけど自身ではそれ以上噛み砕いた説明はできません、てすごいなと思いました。以上です。
返信先:@con_advancing#統計 添付画像はデータの数値「20回中5回表が出た」に関する 二項分布モデル+表の出る確率はpであるという仮説 のWilsonのP値のグラフです。グラフを見ると、表の出る確率はp=0.1であるという仮説とデータの数値の相性は、p=0.5と同じくらい悪そうだと分かります。続く github.com/genkuroki/publ… pic.twitter.com/HnLTZnPfk4
返信先:@con_advancing#統計 P値は、データの数値とモデル+パラメータの値の設定の相性の良さ(compatibility)の指標の1つです。 例えば、 (1) 20回中5回表が出たというデータの数値 に関する (2) 二項分布モデル+表の出る確率は1/2という仮説 のWilsonのP値は2.5%で、この値は(1)と(2)の相性の良さを表します。続く pic.twitter.com/KZ7kF14gNA
#統計 統計学を教える仕事をする人は 統計的有意性とP値に関するASA声明 biometrics.gr.jp/news/all/ASA には目を通しておいた方が無難。 これを読めば、P値に関する実践的に十分な説明と解釈法が得られます。 ただし添付画像への追記部分に注意することも必要。
#統計 #Julia言語 線形回帰のβ₁に関するP値関数 と βとlog σ²について平坦な事前分布での ベイズ版線形回帰のβ₁に関する事後分布 は数学的に「同等」なので、 線形回帰に関するP値を使う方法とベイズ法の違い は 事前分布の平坦分布との違い にちょうど対応。 github.com/genkuroki/publ… pic.twitter.com/Ev5GqQqCja
#統計 帰無仮説(ゼロ仮説)β₁=0単独のP値ではなく、P値関数のグラフを見れば、「P値は閾値αによる2値的判断のために使う」という誤解が訂正されて、「P値は推定のための道具である」というより正しい理解が得られる。 これによってnullism(帰無主義、ゼロ主義)とdichotomania(二分法病)が治療される。 pic.twitter.com/BUl6nRbQGN
#統計 続き。モデルはy=β₀+β₁x+u, u~Normal(0,σ). データの数値とβ₁=0という設定(よく「帰無仮説」と呼ばれる)の相性の良さを表すP値関数の値はP=0.0463. 添付画像のP値関数のグラフを見れば、どの辺のβ₁の値がデータの数値との相性が良いか悪いかが一目瞭然。 P値関数は閾値αを必要としない。 pic.twitter.com/GgpGiYAPw6