自動更新

並べ替え:新着順

ベストポスト
メニューを開く

#統計 添付画像の p.1P値と尤度(ゆうど)を混同 しており、 p.3ではP値と有意水準を混同 しています。 添付画像の2枚目は悪くないと思ったので、1枚目でP値に関する説明がまるっきり間違っている点が痛い。非常にもったいない。 続く pic.twitter.com/BumnTmaV76

Yuki FURUSE 古瀬祐気@ykfrs1217

長崎の盟友である佐藤さん(x.com/Shuntarooo3/st…)や中島さん(x.com/naka_takaya/st…)がP値の説明で界隈を盛り上げているので自分も今週にある弊学のシンポジウムでその話をしようと思ったら「ちゃんと先生の研究成果の話をしてください」とのことだったのでここに供養します

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値関数のグラフは高さαに信頼水準1-αの信頼区間の両端の点をプロットしても得られるので、信頼区間について知っている人にとってP値関数は真に新しい道具とは言えません。 しかし、実際にP値関数のグラフを見たことがあるか否かで、P値や信頼区間に関する理解度が変わる可能性は高いと思う。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値関数について biostat.ucdavis.edu/sites/g/files/… のスクショの添付画像にあるグラフが、P値関数のグラフです。高さαに信頼水準1-αの信頼区間の両端の点をプロットしても同じグラフが得られるので、P値関数は信頼区間関数と呼ばれることもあります。続く pic.twitter.com/AzbpoXxNED

黒木玄 Gen Kuroki@genkuroki

#統計 P値が最大になるaの値は差の点推定値になります。 P値が推定の道具でもあることは論文 scholar.google.co.jp/scholar?cluste… Rafi-Greenland 2020 にも分かるように書いてあるし、Greenlandさんのスライドにもあります。 biostat.ucdavis.edu/sites/g/files/…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 1標本t検定のP値pvalue_ttest(x|μ)は、モデルの仮定の下での、データの数値xと「母平均はμである」という仮説の相性の良さの指標だと解釈される。 母平均の信頼水準1-αの信頼区間confint_ttest(x|α)は、閾値αによってデータの数値と相性が良いと判定されるμの値の範囲だと解釈される。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 nを大きくするとt分布TDist(n-1)は標準正規分布Normal(0, 1)で近似されるようになるので辻褄が合っている。 上のP値の定義で標準正規分布をt分布で置き換えることによって補正されたP値を定義する: pvalue_ttest(x|μ) = 2(1 - cdf(TDist(n-1), |t(μ)|)). これが1標本t検定のP値関数である。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 しかし以上のP値は数値実験すると、nが十分大きいなら十分に機能するが、分布p(xᵢ|μ,σ²,η,η₂,…)がたとえ正規分布であったとしてもn=10程度では誤差が非常に大きくなることが分かる(αエラー率がαより酷く大きくなったりする)。 そこを上手に補正することを考えたい。続き

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 データの数値xでT(μ)中のXを置き換えて得られる値をt(μ)と書くとき、 pvalue_normal(x|μ) = 2(1 - cdf(Normal(0, 1), |t(μ)|)). これが正規分布近似版のP値関数です。信頼水準αのμの信頼区間は confint_normal(x|α) = { μ | pvalue_normal(x|μ)≥α } と定義される。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 母平均の検定や区間推定に使えるP値の構成法 母集団分布を未知だが確定している母平均μを持つ分布p(xᵢ|μ,σ²,η,η₂,…)でモデル化する。σ²は母平均で、η,η₂,…は可能な分布の形状を「任意」にするための無限個のパラメータです。 続く

黒木玄 Gen Kuroki@genkuroki

#統計 例えば、正規分布モデルp(x|μ,σ²)において母平均のモデルでの対応物のμに関する検定や区間推定を行えるようにしたい場合には、分散パラメータσ²によらないμだけの関数としてP値を作る必要があります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

返信先:@BB45_Coloradoこちらの書籍の1章にASA声明以降の統計解析指針について、2章にサリドマイド薬害を例に医療分野の統計利用について良くまとまっています。 初~中級者向けに有意水準検定の問題点とP値解釈の解説がされているので後付け検定的解釈”医クラ”の方たちに是非読んで欲しいですね。 honto.jp/netstore/pd-bo…

メニューを開く

#統計 事後分布ϕ(θ|x)で測った確率が1-αの適当な区間としてベイズ版の信用区間が定義され、P値から定義される信頼区間と同様の使い方をできます。 つまり「信頼も信用もできない区間」として便利に利用できる。 ただし事後分布は事前分布にも依存していることに細心の注意が必要になる場合がある。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 そういう非自明な数学的問題を解いた結果が、1標本t検定のP値の構成法になっています。 正規分布モデル以外の一般のモデルp(x|θ,η)では1標本t検定のようにはうまく行かず、固定しないηに近似的によらない統計量を見つけて、近似的な方法でθのみに依存して決まるP値を構成することになります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 元の正規分布モデルのパラメータはμとσ²の2つなので、μとσ²の2つの値を確定させないと確率分布が1つに決まらない。 μの値だけを確定させ、異なるσ²の値に対応するμだけが等しい無数の正規分布達を同時に使って適切なP値を作る必要があります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値と尤度(ゆうど)のさらに違う部分の解説 データの数値をx=(x,…,xₙ)と1文字でまとめて書き、モデルのパラメータを(θ,η)と2つに分けて書くことにする。 このとき、確定したデータの数値xに関するモデルの尤度はp(x|θ,η)のように書けて、尤度は(θ,η)の関数になる。非常にシンプル。続く pic.twitter.com/bCtZWdsxsq

黒木玄 Gen Kuroki@genkuroki

#統計 解説 P値は、データの数値__以上に極端な__値がモデルの確率分布で生成される確率またはその__近似値__。 尤度の定義は、データの数値__に等しい__値がモデルの確率分布で生成される確率またはその__密度__。 強調部分が違う(本当はさらに違う部分もあるが略)。混同する人が多い。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値と言えば「差はない」型の帰無仮説のnull P値であるという思い込みはnullismという病気の症状の1つ。 P値<5%による安易な二分法はdichotomaniaという病気。 さらに、数学的設定を現実と混同するreificationという病気もある。モデルを疑わない病。 Greenlandさんのまとめは参考になる。

黒木玄 Gen Kuroki@genkuroki

#統計 Greenlandさんが要約しているように * nullism (帰無主義) * dichotomania (二分法病) * reification (モデルを疑わない病(意訳)) などに学生を陥らせないように統計学について解説しないと、有害な教育をしてしまったことになります。 biostat.ucdavis.edu/sites/g/files/…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値のトリセツ(⻑崎⼤学病院初期研修医1年⽬中島誉也)には添付画像のように書いてあります(手書き部分は私のコメント)。 【検定から推定へ】というスローガンは正しい。 しかし、P値も推定のための道具なので、そのスローガンがP値の欠点の話だとするのは誤り。 speakerdeck.com/taka88/pzhi-fa… pic.twitter.com/EvTCxhdhT8

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 Neyman-Pearsonの仮説検定であっても、仮説検定の意味での採択と棄却はそのような決定を実務的にも行うことを意味せず、仮説検定の結果は実務的には参考情報の1つでしかありません。 P値も明記することとNeyman-Pearsonの仮説検定は何も矛盾しない。 みんな大学でデタラメを習って来た。

黒木玄 Gen Kuroki@genkuroki

#統計 Pearson (1955)には NeymanとPearsonは「__最終的な__採択と棄却の話をしていない」し、「仮説検定が不可逆な採択の手続きを強制するべきだとは全然示唆していない」 とはっきり書いてあります。証拠提示終了! 戯画化されたNPについて騙る行為は滅びるべき!

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 リンク先のざっくりした説明での重要なポイントの1つは、よく見るP値に関する有害な説明「P値は有意差を出すために使われる」に一切触れずに、それとは完全に異なる説明の仕方をしていることです。 有害な説明に洗脳済みの人にとっては脱洗脳が必要な分だけ理解が難しくなる。これが大問題。

黒木玄 Gen Kuroki@genkuroki

返信先:@con_advancing#統計 P値は、データの数値とモデル+パラメータの値の設定の相性の良さ(compatibility)の指標の1つです。 例えば、 (1) 20回中5回表が出たというデータの数値 に関する (2) 二項分布モデル+表の出る確率は1/2という仮説 のWilsonのP値は2.5%で、この値は(1)と(2)の相性の良さを表します。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 ASA声明では、P値は、観察データの数値と統計モデル(検定したい仮説を含む)の相性の良さの程度の指標の1つなので、その理解には、パラメータ付き確率分布で記述された統計モデルの概念を知っていることが必須。 パラメータ付き確率分布について何も理解していない人はP値を利用できない。続く

黒木玄 Gen Kuroki@genkuroki

返信先:@con_advancing#統計 P値は、データの数値とモデル+パラメータの値の設定の相性の良さ(compatibility)の指標の1つです。 例えば、 (1) 20回中5回表が出たというデータの数値 に関する (2) 二項分布モデル+表の出る確率は1/2という仮説 のWilsonのP値は2.5%で、この値は(1)と(2)の相性の良さを表します。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 上の続き。その私によるざっくりとした説明は「統計的有意性とP値に関するASA声明」の原則の1の部分の具体例を使った説明になっています。

黒木玄 Gen Kuroki@genkuroki

#統計 統計学を教える仕事をする人は 統計的有意性とP値に関するASA声明 biometrics.gr.jp/news/all/ASA には目を通しておいた方が無難。 これを読めば、P値に関する実践的に十分な説明と解釈法が得られます。 ただし添付画像への追記部分に注意することも必要。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値と有意水準を混同していたまるっきり間違っている説明を擁護してしまった人たちの不満の1つはこのスレッドが長過ぎることにようです。(長過ぎるのは、別の言葉で易しく説明したり、詳しく説明したりの繰り返しだから。) 私によるP値に関するざっくりとした短めの解説 ↓

黒木玄 Gen Kuroki@genkuroki

返信先:@con_advancing#統計 P値は、データの数値とモデル+パラメータの値の設定の相性の良さ(compatibility)の指標の1つです。 例えば、 (1) 20回中5回表が出たというデータの数値 に関する (2) 二項分布モデル+表の出る確率は1/2という仮説 のWilsonのP値は2.5%で、この値は(1)と(2)の相性の良さを表します。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

『ミュートしている方』は IoE かもしれない。2人ともかもしれない。 『おそらく、これが伝統的なP値や検定法に関する教え方が改善されない理由の1つ。』 黒木玄 @genkurokix.com/Shuntarooo3/st…

Sato Shuntaro|佐藤俊太朗@Shuntarooo3

検定のスライドについていろいろとご指摘を受けているようですが,ミュートしている方なので,平穏のために覗かないようにします. なので,わたしの反応がないことはご指摘に同意を示しているわけではないです.見ていないのが理由です.

Illusion of Evidence (IoE)@ueafam

メニューを開く

#統計 実は対立仮説がp≠1/2の場合には、検出力が一様に最も高いという意味での最強の検定法(今の場合はP値の構成法)は存在しないので、適当に条件を緩めて、効率の良い検定法を与えるP値の構成法を探すことになります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値はそれがα未満のとき帰無仮説を棄却する(「棄却」は数学用語扱い)という形で使われ、帰無仮説の下での二項分布に従う確率変数Kに関する確率 データKによって帰無仮説が棄却される確率=P(pvalue(K)<α) をαエラー率(第1種の過誤の確率)と呼びます。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 おそらく、これが伝統的なP値や検定法に関する教え方が改善されない理由の1つ。 pic.twitter.com/BlGwoVigWh

Sato Shuntaro|佐藤俊太朗@Shuntarooo3

検定のスライドについていろいろとご指摘を受けているようですが,ミュートしている方なので,平穏のために覗かないようにします. なので,わたしの反応がないことはご指摘に同意を示しているわけではないです.見ていないのが理由です.

黒木玄 Gen Kuroki@genkuroki

メニューを開く

『〜 薬の承認制度は第1,2,3相の多段階治験をすべてクリアさせる非常に厳しい試練を課しています。 最終の第3相治験に入る前までにテストしている薬達のうち半分以上が効く薬ならば、第3相の主要評価項目の成否を「P値<α」という条件で判断しても安全性はかなり高くなる。』 x.com/genkuroki/stat…

黒木玄 Gen Kuroki@genkuroki

#統計 現実社会での薬の承認制度は第1,2,3相の多段階治験をすべてクリアさせる非常に厳しい試練を課しています。 最終の第3相治験に入る前までにテストしている薬達のうち半分以上が効く薬ならば、第3相の主要評価項目の成否を「P値<α」という条件で判断しても安全性はかなり高くなる。

Illusion of Evidence (IoE)@ueafam

メニューを開く

返信先:@genkuroki臨床医はp=0.82をだめな結果と思い、小さいp値を凄い結果だと思う方ばかりで、サンプルサイズとp値の関係を知っている方が稀と感じますのでは当たり前とは言えないのでは?100万例集めてOR1.06,95%CI 1.01-1.12は差がほとんどない(少ない数では差が出ない)と思うのですがpubmed.ncbi.nlm.nih.gov/37647075/

kouraboshi@kouraboshi

メニューを開く

#統計 現実社会での薬の承認制度は第1,2,3相の多段階治験をすべてクリアさせる非常に厳しい試練を課しています。 最終の第3相治験に入る前までにテストしている薬達のうち半分以上が効く薬ならば、第3相の主要評価項目の成否を「P値<α」という条件で判断しても安全性はかなり高くなる。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値は大きいほどcompatibleになる指標なので、原文も素直に"how compatible"とすれば分かり易かった。日本語では P値はデータの数値と統計モデルと検定したい仮説の組み合わせの相性の良さの程度を示す指標の1つである のように説明すればぴったりだと思います。 pic.twitter.com/dQWVaFl6od

黒木玄 Gen Kuroki@genkuroki

#統計 ASA声明の原文は scholar.google.co.jp/scholar?cluste… 経由で読めます。その原則の1に原文は 1. P-values can indicate how incompatible the data are with a specified statistical model. です。incompatibleという単語の翻訳は難しい。佐藤俊哉さんはhow incompatibleを「矛盾する程度」と翻訳。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

最近知った値の中で1番難しい値、p値

コウノアスヤ@asuyakono

メニューを開く

Augmented Dickey-Fuller Testをかましたらp値1%未満なのにACFが明らかな正弦波を描いていて周期性がある。むう、これはめんどくさいやつだ…

鄭大潤@jdaeyun

メニューを開く

11位ミュージカル『刀剣乱舞』八(すえひろがり)乱舞野外祭特別スクリーン版 累計動員 週末額5603万5400円 累計額1億8931万7200円 12位劇場版ハイキュー!! ゴミ捨て場の決戦 累計動員767万4195人(土日P値10位) 週末額4321万9400円 累計額109億8319万0690円

さとる9116@RgQwWwqeJJ6Fw31

メニューを開く

今のところのデータだと、当落との紐づけでどれも有意性が無いな・・・ p値が低かったのは、申込枚数と当落の結果かな(p値0.092)

ノイミーデータ分析@not_equal_data

メニューを開く

R の fisher.test の出力する信頼区間が p と整合しないことは奥村先生も指摘しているけど(okumuralab.org/~okumura/stat/…)その理由は理解してなかった。片側p値の小さい方の2倍で計算してるのね > print(confint_fisher2(X)) $oddsratio [1] 1.094174 22.873980 gist.github.com/abikoushi/2fc9…

阿部2@cocotan_0

メニューを開く

#統計 ASA声明での原則の1でのP値の説明で、素直にcompatibleとせずに、incompatibleとした理由も悪しき伝統の踏襲に見えます。 その悪しき伝統とは、「P値<α」という条件で帰無仮説を否定するためにP値を使うことです。だから否定を含むincompatibleという単語を使いたくなってしまったのでしょう。

黒木玄 Gen Kuroki@genkuroki

#統計 続き。しかし「矛盾する程度」の「矛盾する」は相当に強い響きを持つので、P値単体には大して力はないことを強調したい文書の翻訳では不適切だと私は思いました。 あと、P値は大きい方がよりcompatibleになるので、原則の1のhow incompatibleはhow compatibleとした方が良かったと思います。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 続き。しかし「矛盾する程度」の「矛盾する」は相当に強い響きを持つので、P値単体には大して力はないことを強調したい文書の翻訳では不適切だと私は思いました。 あと、P値は大きい方がよりcompatibleになるので、原則の1のhow incompatibleはhow compatibleとした方が良かったと思います。 pic.twitter.com/Y0XjduHMnm

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 1つ上のような使い方をするには、P値の解釈ではP値の力が弱いことを示唆する弱い言葉が好ましいと私は思いました。 「相性の良さ」とは別の候補として「整合性」「適合度」のような言葉も十分合理的で有力なのですが、最も弱く響くのは「相性の良さ」なので、「相性の良さ」を多用しています。

黒木玄 Gen Kuroki@genkuroki

#統計 P値を「データの数値とモデル+パラメータの値の設定の相性の良さの指標の1つ」だと解釈しても、科学的な結論は何も得られない。この点が非常に重要。 そのお陰でそういうP値の解釈を使う人は科学的結論を出すためには追加の困難な議論を強制されることになる。この点は科学的に非常に好ましい。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値を「データの数値とモデル+パラメータの値の設定の相性の良さの指標の1つ」だと解釈しても、科学的な結論は何も得られない。この点が非常に重要。 そのお陰でそういうP値の解釈を使う人は科学的結論を出すためには追加の困難な議論を強制されることになる。この点は科学的に非常に好ましい。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 「真の分布」という言い方を知っている人のための補足 P値を「データの数値とモデル+パラメータの値の設定の相性の良さの指標の1つ」とみなす解釈では、データの数値の背後に真の分布があると仮定する必要はありません。 そういう感じの意味で「相性の良さ」という解釈では追加の仮定は不要。

黒木玄 Gen Kuroki@genkuroki

#統計 補足。 確定した数値としてのデータの数値ではなく、母集団分布の標本分布に従う確率変数としてデータを扱うことがよくありますが、P値を「データの数値とモデル+パラメータの値の設定の相性の良さの指標」だと解釈するときには、データの数値は確率変数ではなく確定した数値で構いません。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 Googleで"P値" "リンボーダンス"を検索 google.com/search?q=%22P%… すると、P値のダメな使い方をリンボーダンスのたとえで説明している他の事例も見つかりました。 その1つの内容はまるっきり間違っていた。 統計学の入門的解説はこんなのが多数派。深刻な問題だと思います。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

返信先:@kend_masterp値を条件付き確率により定義した場合の注意点は条件の確率が0である場合(p(H0)=0の場合)に、p値が(全確率則においてでないと)定義されなくなってしまう(P(A|B):=P(A∧B)/P(B)はP(B)=0だと0-1の値をもたない)ことですが、これはご指摘の活用上の注意点とはまた別の話でしょうね...

高橋泰城(たかはしたいき)@tweet_taiki

トレンド6:29更新

  1. 1

    スポーツ

    ベリンガム

    • サウスゲート
    • フォーデン
    • メイヌー
    • イングランド
    • グリーリッシュ
    • サウスゲイト
    • TAA
    • アーノルド
    • パーマー
    • 南門
    • ギャラガー
    • ゴードン
    • マドリー
  2. 2

    エンタメ

    キリン 午後の紅茶

    • 中条あやみ
    • ヒゲダン
    • 午後の紅茶 新CM
    • Official髭男dism
    • 目黒蓮 キリン
    • CM起用
    • 目黒蓮
    • 髭男
  3. 3

    ニュース

    外国人実習生

    • 名乗るほどの者ではない
    • 飛び込んだ
    • 6歳男児
    • 立ち去る
    • 教えてほしい
  4. 4

    エンタメ

    二宮和也誕生祭

    • 二宮和也
  5. 5

    ニュース

    蓮舫流行ってる

    • セクシー田中さん
  6. 6

    スポーツ

    ボーウェン

    • フォーデン
    • メイヌー
    • グリーリッシュ
    • パーマー
    • 南門
    • ギャラガー
    • パルマー
    • ゴードン
  7. 7

    エンタメ

    SWAROVSKI

    • スワロフスキー
    • 渡辺翔太 スワロフスキー
    • 日本から
    • 渡辺翔太
    • Snow Man
  8. 8

    スポーツ

    トリッピアー

    • フォーデン
    • グリーリッシュ
  9. 9

    アニメ・ゲーム

    中尾隆聖さん

    • 鎹鴉
    • 釘宮理恵
    • フリーザ様
    • 中尾隆聖
  10. 10

    エンタメ

    山寺宏一

    • 波瑠
    • ニノ
20位まで見る

人気ポスト

電車遅延(在来線、私鉄、地下鉄)

遅延している路線はありません

全国の運行情報(Yahoo!路線情報)
よく使う路線を登録すると遅延情報をお知らせ Yahoo!リアルタイム検索アプリ
Yahoo!リアルタイム検索アプリ