自動更新

並べ替え:新着順

ベストポスト
メニューを開く

p値を計算するには必ず確率分布(例えば正規分布)に対する仮定が必要なのでそのことを明示しない説明は間違い」というのはある種「パラメトリックモデル教」みたいなものに取り憑かれすぎ(赤池ismとも深く関連する)で、実際には平均と分散だけ仮定すればp〜uniform[0,1]になるとかあるのでは

Ohkubo Yusaku@Ohkubo2021

メニューを開く

⑤ 過剰な死亡の減少は、Kendall τbテストを使用したp値0.002の州別のIVM分布の程度と相関しています。 結論 1987年以来、世界中で37億回分で安全に使用されている薬であるIVMによる大量治療は、逆転したIVM政策の下で13倍に増加する前に、ペルーで過剰死亡が1/14に減少した可能性が最も高い。

怖すぎて草@SU9828931769850

メニューを開く

#統計 P値関数と事後分布のグラフの例を追加。 以下のリンク先のグラフは、線形回帰モデルy=β₀+βx+u, u~Normal(0,σ)におけるβに関するP値関数と事後分布のグラフです。 (β₀, β, log σ²)に関する平坦事前分布によるベイズ版線形回帰の結果は通常の線形回帰にぴったり誤差無しに一致します。 pic.twitter.com/JFZTSqsaBS

黒木玄 Gen Kuroki@genkuroki

#統計 #Julia言語 線形回帰のβ₁に関するP値関数 と βとlog σ²について平坦な事前分布での ベイズ版線形回帰のβ₁に関する事後分布 は数学的に「同等」なので、 線形回帰に関するP値を使う方法とベイズ法の違い は 事前分布の平坦分布との違い にちょうど対応。 github.com/genkuroki/publ…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 上のP値は二項分布の正規分布近似を使って作ったP値です。他にも漸近的に同値なP値の作り方が無数にある。 二項分布の正規分布近似を使って作ったP値は  特定の統計モデルにおいてデータの数値以上に極端な値が生成される確率 としてのP値の分かり易い例の1つになっています。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 データの数値「n回中k回当たり」に関する仮説「当たりが出る確率はpである」のP値の計算の仕方: 「当たりが出る確率はpである」の設定の二項分布を考える。 ②その二項分布は期待値np、分散np(1-p)の正規分布で近似される。 ③P値=その正規分布でnpからk以上離れた値が生成される確率 pic.twitter.com/LWKkvpC7Ii

黒木玄 Gen Kuroki@genkuroki

#統計 添付画像は、ルーレットを20回まわしたら当たりが5回出たというデータの数値に関する二項分布モデル+「当たりが出る確率はpである」という仮説のP値のグラフです。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値に関する誤解や誤用を11つ否定して行っても、根っこにある「楽にお墨付きを得たい」という欲望にタッチしていないので、モグラ叩きになってしまう。 P値単体では決して科学的お墨付きは得られない、とはっきり分かるように教育の仕方を変える必要がある。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 どうしてこういう補足を書いたのか? 統計学の応用時によく見られる病気にnullism, dichotomania, reificationがあります。 P値として「差がない」の型の帰無仮説のP値しか考えない傾向はnullismの症状の1つ。 nullismに誤誘導してしまわないようにこういう補足を書きました。

黒木玄 Gen Kuroki@genkuroki

#統計 パラメータRD, RR, ORを RD=p-q RR=p/q OR=(p/(1-p))/(q/(1-q)) とおいて、 仮説「RD=具体的な数値」のP値 仮説「RR=具体的な数値」のP値 仮説「OR=具体的な数値」のP値 も作ることができます。0<p,q<1のとき p=q⇔RD=0⇔RR=1⇔OR=1. RD, RR, ORはpとqの違いの異なる指標になっている。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 パラメータRD, RR, ORを RD=p-q RR=p/q OR=(p/(1-p))/(q/(1-q)) とおいて、 仮説「RD=具体的な数値」のP値 仮説「RR=具体的な数値」のP値 仮説「OR=具体的な数値」のP値 も作ることができます。0<p,q<1のとき p=q⇔RD=0⇔RR=1⇔OR=1. RD, RR, ORはpとqの違いの異なる指標になっている。

黒木玄 Gen Kuroki@genkuroki

#統計 例えば、2つの二項分布モデルBinomial(m, p)×Binomial(n, q)での「p=q」という仮説のP値を作りたいとき、pをp=qと設定してもqの値は決まりません。P値はqに依存しないように作る必要があります。 この問題の良い解答には、Pearsonのχ²検定の方法やFisher検定の方法などがあります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

このポストに関連してですが、経済学の実証分析(すなわち計量経済学の論文)において、自分の知る限り、P値関数を使用して、それが推定の1方法であると明確に語っている論文にいまだ遭遇していません。もしもそう語っている情報(論文)を教えていただければ嬉しい限りです。

Ilfan_Oh@Ilfan_Oh

メニューを開く

#統計 1つ上の投稿の内容は実質的に、有意水準α=0.05での帰無仮説「当たりが出る確率はp=1/2」の両側検定の話と同じです。 しかし、「棄却」のような強い言葉を使わずに「相性が悪い」と言っています。P値のみによる判断は危ないので、個人的には曖昧に響く「相性が悪い」の方が安全だと思います。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 仮にデータ取得前に決めておいた閾値α=0.05によって、P値がα以上なら相性が良い、α未満なら相性が悪いと2値的な判断をすることにしていたとする。 そのとき、p=1/2のP値は約0.025なので「当たりが出る確率は1/2」という仮説と「20回中5回」というデータの数値は相性が悪いと判断されます。 pic.twitter.com/Su9gyRb49c

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 別のよりくだけた言い方。 特定の統計モデルの下で、検定したい仮説が正しいのにP値<αとなる確率(この確率をαエラー率と呼ぶ)はおおよそαになる。 「αエラー」と「第1種の過誤」は同じ意味。 「おおよそαになる」を「α以下になる」のようにする場合もあります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 ASA声明 scholar.google.co.jp/scholar?cluste… の原則の1の"the data"は「観察データの数値」と翻訳して、原則の1の全体を P値は観察データの数値と特定の統計モデルの相性の良さの程度を表す と翻訳するとより分かりやすいと思う。 「観察データの数値」は確定した数値であり、確率変数ではない。

黒木玄 Gen Kuroki@genkuroki

#統計 ASA声明 scholar.google.co.jp/scholar?cluste… の原則の1: P-values can indicate how incompatible the data are with a specified statistical model. 値の大小関係を保つには"how compatible"(相性の良さ)とした方がよい。私訳: P値はデータと特定の統計モデルの相性の良さの程度を表す。 続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 ASA声明の原則の1的な (1) P値はデータと特定の統計モデルの相性の良さの程度を表す と伝統的説明の (2) P値は統計的有意差を出すために使われる は整合性を取ることが難しい。この点についてクリアに考えることは大事なことだと思います。私は(2)は明瞭に否定されるべきだと思っています。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計P値はデータと特定の統計モデルの相性の良さの程度を表す」というASA声明の原則の1的な説明を最初にすれば、有意水準αを設定した2値的判断と無関係にP値をどのように解釈すれば良いかが最初から明瞭になります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 ASA声明 scholar.google.co.jp/scholar?cluste… の原則の1: P-values can indicate how incompatible the data are with a specified statistical model. 値の大小関係を保つには"how compatible"(相性の良さ)とした方がよい。私訳: P値はデータと特定の統計モデルの相性の良さの程度を表す。 続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 両側P値<5%の条件で判断を下す場合には、テストする(対立)仮説達の中で実際に正しいものの割合が大雑把に半分程度以上になる状況で行うべき。 薬の治験は第1,2,3相の多段階になっており、最終の第3相試験の前までにそうなるように期待されているのだと思う。P値云々よりも制度全体が重要。

黒木玄 Gen Kuroki@genkuroki

#統計 テストする薬達の中での効く薬の割合pが50%ならば、有意水準5%(両側)の「危険率」の仮説検定で「効く」と判定された薬達の中での実際には効かない薬の割合は3%と小さめの値になる。 しかし、p=10%、5%、1%ならば同割合は22%、37%、76%と大きくなり、酷いことになります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

100万人以上に楽しんでもらえたみたいなので、あとで続きを。定義を踏まえ、まずざっくり解釈を言ってから順を追って、以下: ①p値的なもの、帰無仮説の考え方 ②有意水準とは恣意的なものである ③仮説検定の考え方 ④p値と"仮説が正しい"確率とは無縁である。 (教えるのって難しいんですよ...)

竹内幹@takekan

「p値」って何といわれて全く答えられない人に、計量経済入門の単位とか認定しちゃだめだよなあ、と思っている。 ざっくりいえば、p値(p-value)は「ある結論が、実はただの勘違いである可能性」と解釈できる。(小声でいうと、小さい方がうれしい) 例えば、学生グループAとBのテストの成績差。

竹内幹@takekan

メニューを開く

#統計 ちょっと面白いのは、Lehmann, Testing Statistical Hypothesesの第1版ではP値をcritical level (臨界水準)と呼んでいたこと。 第2版で、significance probability (有意確率)、p-value (P値)と呼ぶようになった。 NP流なので "how ~ contradict"と「矛盾」という強い言葉を使う傾向がある。 pic.twitter.com/cwz7tjZT0G

黒木玄 Gen Kuroki@genkuroki

#統計 Neyman-Pearson流の検定の定式化でのP値の定義の仕方については、Lehmann, Testing Statistical Hypotheses, 2nd edition, 1986のp.70を参照(添付画像1)。 1959年版ではp-valueとは呼んでなかった(添付画像2)。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 Welchのt検定の導出で使われるt統計量の定義式の分母の2乗が従う分布のχ²分布の定数倍による近似は、正規母集団の仮定からの逸脱について脆弱で一般にはうまく行きません。 しかし、自由度がmin(m-1, n-1)以上になるお陰でm,nが十分大きいならP値レベルでは正規母集団の仮定からの逸脱に頑健。 pic.twitter.com/w2oKEYfRBm

黒木玄 Gen Kuroki@genkuroki

#統計 Welchのt検定で使われる 正規母集団の仮定の下での(S_X)²/m+(S_Y)²/n の分布の自由度νのχ²分布のa倍による期待値と分散を揃える近似 は正規母集団の仮定からの逸脱に脆弱なのですが、使用するt分布の自由度はmin(m-1,n-1)以上になるので、m,nが大きいならP値のレベルでは頑健になります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 例えば、正規分布モデルでの「母平均はμ=170である」という仮説のP値を作りたいとき、正規分布モデルのもう1つのパラメータσ²は任意のままで、σ²に依存しないようにP値を作る必要があります。 この問題の優れた解答が1標本t検定のP値の構成法です。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 例えば、モデルの確率分布がθとηの2つのパラメータを持つとき、仮説「θ=0」を検定で扱うときには、その設定の下でもう1つのパラメータηの値は「任意」ということになります。 しかし、仮説「θ=0」のP値はもう1つのパラメータηに依存せずに決まるように作る必要があります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 以下のリンク先スレッドには「t分布は単なるどんぶり勘定な補正としてのみ使われている」という立場で1標本t検定のP値関数を作るための粗筋が書かれています。 2標本の場合に同様にするとWelchのt検定が得られます。t分布による補正がなくてもそれなりに実用的なのでWelchのt検定は頑健になる。

黒木玄 Gen Kuroki@genkuroki

#統計 母平均の検定や区間推定に使えるP値の構成法 母集団分布を未知だが確定している母平均μを持つ分布p(xᵢ|μ,σ²,η₁,η₂,…)でモデル化する。σ²は母平均で、η₁,η₂,…は可能な分布の形状を「任意」にするための無限個のパラメータです。 続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値関数のグラフは高さαに信頼水準1-αの信頼区間の両端の点をプロットしても得られるので、信頼区間について知っている人にとってP値関数は真に新しい道具とは言えません。 しかし、実際にP値関数のグラフを見たことがあるか否かで、P値や信頼区間に関する理解度が変わる可能性は高いと思う。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値関数について biostat.ucdavis.edu/sites/g/files/… のスクショの添付画像にあるグラフが、P値関数のグラフです。高さαに信頼水準1-αの信頼区間の両端の点をプロットしても同じグラフが得られるので、P値関数は信頼区間関数と呼ばれることもあります。続く pic.twitter.com/AzbpoXxNED

黒木玄 Gen Kuroki@genkuroki

#統計 P値が最大になるaの値は差の点推定値になります。 P値が推定の道具でもあることは論文 scholar.google.co.jp/scholar?cluste… Rafi-Greenland 2020 にも分かるように書いてあるし、Greenlandさんのスライドにもあります。 biostat.ucdavis.edu/sites/g/files/…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 1標本t検定のP値pvalue_ttest(x|μ)は、モデルの仮定の下での、データの数値xと「母平均はμである」という仮説の相性の良さの指標だと解釈される。 母平均の信頼水準1-αの信頼区間confint_ttest(x|α)は、閾値αによってデータの数値と相性が良いと判定されるμの値の範囲だと解釈される。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 nを大きくするとt分布TDist(n-1)は標準正規分布Normal(0, 1)で近似されるようになるので辻褄が合っている。 上のP値の定義で標準正規分布をt分布で置き換えることによって補正されたP値を定義する: pvalue_ttest(x|μ) = 2(1 - cdf(TDist(n-1), |t(μ)|)). これが1標本t検定のP値関数である。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 しかし以上のP値は数値実験すると、nが十分大きいなら十分に機能するが、分布p(xᵢ|μ,σ²,η,η₂,…)がたとえ正規分布であったとしてもn=10程度では誤差が非常に大きくなることが分かる(αエラー率がαより酷く大きくなったりする)。 そこを上手に補正することを考えたい。続き

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 データの数値xでT(μ)中のXを置き換えて得られる値をt(μ)と書くとき、 pvalue_normal(x|μ) = 2(1 - cdf(Normal(0, 1), |t(μ)|)). これが正規分布近似版のP値関数です。信頼水準αのμの信頼区間は confint_normal(x|α) = { μ | pvalue_normal(x|μ)≥α } と定義される。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 母平均の検定や区間推定に使えるP値の構成法 母集団分布を未知だが確定している母平均μを持つ分布p(xᵢ|μ,σ²,η,η₂,…)でモデル化する。σ²は母平均で、η,η₂,…は可能な分布の形状を「任意」にするための無限個のパラメータです。 続く

黒木玄 Gen Kuroki@genkuroki

#統計 例えば、正規分布モデルp(x|μ,σ²)において母平均のモデルでの対応物のμに関する検定や区間推定を行えるようにしたい場合には、分散パラメータσ²によらないμだけの関数としてP値を作る必要があります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

返信先:@BB45_Coloradoこちらの書籍の1章にASA声明以降の統計解析指針について、2章にサリドマイド薬害を例に医療分野の統計利用について良くまとまっています。 初~中級者向けに有意水準検定の問題点とP値解釈の解説がされているので後付け検定的解釈”医クラ”の方たちに是非読んで欲しいですね。 honto.jp/netstore/pd-bo…

メニューを開く

#統計 事後分布ϕ(θ|x)で測った確率が1-αの適当な区間としてベイズ版の信用区間が定義され、P値から定義される信頼区間と同様の使い方をできます。 つまり「信頼も信用もできない区間」として便利に利用できる。 ただし事後分布は事前分布にも依存していることに細心の注意が必要になる場合がある。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 そういう非自明な数学的問題を解いた結果が、1標本t検定のP値の構成法になっています。 正規分布モデル以外の一般のモデルp(x|θ,η)では1標本t検定のようにはうまく行かず、固定しないηに近似的によらない統計量を見つけて、近似的な方法でθのみに依存して決まるP値を構成することになります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 元の正規分布モデルのパラメータはμとσ²の2つなので、μとσ²の2つの値を確定させないと確率分布が1つに決まらない。 μの値だけを確定させ、異なるσ²の値に対応するμだけが等しい無数の正規分布達を同時に使って適切なP値を作る必要があります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値と尤度(ゆうど)のさらに違う部分の解説 データの数値をx=(x,…,xₙ)と1文字でまとめて書き、モデルのパラメータを(θ,η)と2つに分けて書くことにする。 このとき、確定したデータの数値xに関するモデルの尤度はp(x|θ,η)のように書けて、尤度は(θ,η)の関数になる。非常にシンプル。続く pic.twitter.com/bCtZWdsxsq

黒木玄 Gen Kuroki@genkuroki

#統計 解説 P値は、データの数値__以上に極端な__値がモデルの確率分布で生成される確率またはその__近似値__。 尤度の定義は、データの数値__に等しい__値がモデルの確率分布で生成される確率またはその__密度__。 強調部分が違う(本当はさらに違う部分もあるが略)。混同する人が多い。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 添付画像の p.1P値と尤度(ゆうど)を混同 しており、 p.3ではP値と有意水準を混同 しています。 添付画像の2枚目は悪くないと思ったので、1枚目でP値に関する説明がまるっきり間違っている点が痛い。非常にもったいない。 続く pic.twitter.com/BumnTmaV76

Yuki FURUSE 古瀬祐気@ykfrs1217

長崎の盟友である佐藤さん(x.com/Shuntarooo3/st…)や中島さん(x.com/naka_takaya/st…)がP値の説明で界隈を盛り上げているので自分も今週にある弊学のシンポジウムでその話をしようと思ったら「ちゃんと先生の研究成果の話をしてください」とのことだったのでここに供養します

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値と言えば「差はない」型の帰無仮説のnull P値であるという思い込みはnullismという病気の症状の1つ。 P値<5%による安易な二分法はdichotomaniaという病気。 さらに、数学的設定を現実と混同するreificationという病気もある。モデルを疑わない病。 Greenlandさんのまとめは参考になる。

黒木玄 Gen Kuroki@genkuroki

#統計 Greenlandさんが要約しているように * nullism (帰無主義) * dichotomania (二分法病) * reification (モデルを疑わない病(意訳)) などに学生を陥らせないように統計学について解説しないと、有害な教育をしてしまったことになります。 biostat.ucdavis.edu/sites/g/files/…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値のトリセツ(⻑崎⼤学病院初期研修医1年⽬中島誉也)には添付画像のように書いてあります(手書き部分は私のコメント)。 【検定から推定へ】というスローガンは正しい。 しかし、P値も推定のための道具なので、そのスローガンがP値の欠点の話だとするのは誤り。 speakerdeck.com/taka88/pzhi-fa… pic.twitter.com/EvTCxhdhT8

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 Neyman-Pearsonの仮説検定であっても、仮説検定の意味での採択と棄却はそのような決定を実務的にも行うことを意味せず、仮説検定の結果は実務的には参考情報の1つでしかありません。 P値も明記することとNeyman-Pearsonの仮説検定は何も矛盾しない。 みんな大学でデタラメを習って来た。

黒木玄 Gen Kuroki@genkuroki

#統計 Pearson (1955)には NeymanとPearsonは「__最終的な__採択と棄却の話をしていない」し、「仮説検定が不可逆な採択の手続きを強制するべきだとは全然示唆していない」 とはっきり書いてあります。証拠提示終了! 戯画化されたNPについて騙る行為は滅びるべき!

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 リンク先のざっくりした説明での重要なポイントの1つは、よく見るP値に関する有害な説明「P値は有意差を出すために使われる」に一切触れずに、それとは完全に異なる説明の仕方をしていることです。 有害な説明に洗脳済みの人にとっては脱洗脳が必要な分だけ理解が難しくなる。これが大問題。

黒木玄 Gen Kuroki@genkuroki

返信先:@con_advancing#統計 P値は、データの数値とモデル+パラメータの値の設定の相性の良さ(compatibility)の指標の1つです。 例えば、 (1) 20回中5回表が出たというデータの数値 に関する (2) 二項分布モデル+表の出る確率は1/2という仮説 のWilsonのP値は2.5%で、この値は(1)と(2)の相性の良さを表します。続く

黒木玄 Gen Kuroki@genkuroki

トレンド11:07更新

  1. 1

    エンタメ

    愛は地球を救うのか?

    • 愛は地球を救う
    • チャリTシャツ
    • 宮崎吾朗
    • 24時間テレビ
    • 愛は地球を救わない
    • 救うのか
    • 愛は地球を救うのか
    • 地球を救う
    • チャリT
    • 日テレ
  2. 2

    アニメ・ゲーム

    東京駅一番街

    • TOKYO
  3. 3

    このまま黙って死んだら私に悔いが残る

    • 実名告白
    • 大学生活
    • 文春オンライン
    • 小池百合子
    • 文春
  4. 4

    エンタメ

    真実の口方式

    • Ado 箱
    • Ado
    • Ado握手会
    • 真実の口
    • 握手会
    • 1000人
  5. 5

    エンタメ

    青木マッチョ

    • パーマ大佐
    • シンバル
    • 出番なし
    • 太鼓の達人
    • フルコンボ
  6. 6

    管理会社

    • 給湯器
  7. 7

    水卜アナ

    • 24時間テレビ
    • 水卜ちゃん
    • 水卜麻美アナ
    • 原作者殺し
    • 水卜麻美
    • 24時間テレビチャリティー委員会
    • 中村倫也さん
  8. 8

    ニュース

    公職選挙法違反疑惑

    • 北村弁護士
    • 東京都知事選挙
    • 公職選挙法違反
    • 東京都知事
  9. 9

    エンタメ

    新しい恋人達に

    • back number
    • 海のはじまり
    • 本編映像
    • 主題歌
  10. 10

    ITビジネス

    感染被害率

    • 割に合わない
    • 日本企業
    • ウイルス
    • KADOKAWA
20位まで見る

人気ポスト

よく使う路線を登録すると遅延情報をお知らせ Yahoo!リアルタイム検索アプリ
Yahoo!リアルタイム検索アプリ