自動更新

並べ替え:新着順

ベストポスト
メニューを開く

#統計P値<αならば帰無仮説は成立し難いと判断できる(帰無仮説を棄却)】は典型的な誤りの1つになるので要注意!

黒木玄 Gen Kuroki@genkuroki

#統計 P値について説明したいなら、 【有意な検定結果(P≤0.05)は帰無仮説が誤りであり、棄却するべきであることを意味する】 は誤りであることにも注意が必要です。同じ理由で 【P値<αならば帰無仮説は成立し難いと判断できる(帰無仮説を棄却)】 も典型的な誤りになります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 ASA声明原則の1でのP値の基本的な解釈の仕方の説明には、仮説検定と無関係に言える解釈が書かれています。 ASA声明を読まずに(もしくは読んでいても)、P値の解釈は仮説検定について触れないと説明できないと思っている人達は、最初の所でつまずいていることになります。

黒木玄 Gen Kuroki@genkuroki

#統計 ASA声明 scholar.google.co.jp/scholar?cluste… の原則の1にあるP値の解釈の仕方 原文: P-values can indicate how incompatible the data are with a specified statistical model. 私訳: P値はデータの数値と特定の統計モデル(検定したい仮説もモデルの仮定の一部分)の相性の良さの程度を表す。 続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 ASA声明 scholar.google.co.jp/scholar?cluste… の原則の1にあるP値の解釈の仕方 原文: P-values can indicate how incompatible the data are with a specified statistical model. 私訳: P値はデータの数値と特定の統計モデル(検定したい仮説もモデルの仮定の一部分)の相性の良さの程度を表す。 続く

黒木玄 Gen Kuroki@genkuroki

#統計 ASA声明 scholar.google.co.jp/scholar?cluste… の原則の1: P-values can indicate how incompatible the data are with a specified statistical model. 値の大小関係を保つには"how compatible"(相性の良さ)とした方がよい。私訳: P値はデータと特定の統計モデルの相性の良さの程度を表す。 続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計P値<αならば帰無仮説は成立し難いと判断できる】の類誤りになる理由は複数通りあります。 理由1: データの取得法に不備がある可能性や、モデルの妥当性の保証がない場合には、たとえP値<0.001であっても「帰無仮説は成立し難い」とは判断できません。これは統計学の基本中の基本です。 続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

返信先:@Deponn_d6帰無仮説は○○ではない 有意水準5%で検定を行ったとすると、p値が0.05以下であるとき→有意であり、帰無仮説を棄却する (1-p)*100[%] の確率で帰無仮説が棄却される、 ということだと思います。

らぐ@Rag_1120

メニューを開く

返信先:@ALeX_EXVS最初にどの様にレギュレーションを決めたのか?次第ではないでしょうか?🤗✨ クレンジングが行き届いたステキなデータ群に対してでしたら、各データの正規性や相関の再現性、問いの弁別性なども申し分なくてType1エラーも起きにくいなどP値に絶大な信頼があるかもですが、きっと稀でしょうから🤗✨

Atussyさんと他78人のみな@Atussy74049877

メニューを開く

本日は5.1節と5.2節を扱いました。対応のないt検定を題材に、統計的検定の論理とエラー確率のコントロールについて確認しました。p値を実際に計算しました。 pic.twitter.com/kUNxHbDLkH

Kawashima Lab.@TKawashimaExp

メニューを開く

#統計 Wilsonの信頼区間を与えるP値は、「データの数値の9以上に5から離れた値(すなわち9以上または1以下の値)が生成される確率だと言えるので、「データの数値以上に極端な値が生成される確率」の特殊な場合とみなせます。 WaldのP値も同様ですが、Clopper-PearsonのP値とSterneのP値の説明は面倒。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 Wilsonの信頼区間に対応するP値なら以下のように言える(添付画像左下): 二項分布Binomial(20, 0.25)は正規分布Normal(5, √3.75)で近似される。 ②P値はその正規分布において  モデルの期待値20×0.25=5回から  データの数値の9回以上に離れた値が  生成される確率 として計算される。 pic.twitter.com/3bysfbL2KQ

黒木玄 Gen Kuroki@genkuroki

メニューを開く

⑤ 過剰な死亡の減少は、Kendall τbテストを使用したp値0.002の州別のIVM分布の程度と相関しています。 結論 1987年以来、世界中で37億回分で安全に使用されている薬であるIVMによる大量治療は、逆転したIVM政策の下で13倍に増加する前に、ペルーで過剰死亡が1/14に減少した可能性が最も高い。

怖すぎて草@SU9828931769850

メニューを開く

p値を計算するには必ず確率分布(例えば正規分布)に対する仮定が必要なのでそのことを明示しない説明は間違い」というのはある種「パラメトリックモデル教」みたいなものに取り憑かれすぎ(赤池ismとも深く関連する)で、実際には平均と分散だけ仮定すればp〜uniform[0,1]になるとかあるのでは

Ohkubo Yusaku@Ohkubo2021

メニューを開く

#統計 P値関数と事後分布のグラフの例を追加。 以下のリンク先のグラフは、線形回帰モデルy=β₀+βx+u, u~Normal(0,σ)におけるβに関するP値関数と事後分布のグラフです。 (β₀, β, log σ²)に関する平坦事前分布によるベイズ版線形回帰の結果は通常の線形回帰にぴったり誤差無しに一致します。 pic.twitter.com/JFZTSqsaBS

黒木玄 Gen Kuroki@genkuroki

#統計 #Julia言語 線形回帰のβ₁に関するP値関数 と βとlog σ²について平坦な事前分布での ベイズ版線形回帰のβ₁に関する事後分布 は数学的に「同等」なので、 線形回帰に関するP値を使う方法とベイズ法の違い は 事前分布の平坦分布との違い にちょうど対応。 github.com/genkuroki/publ…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 上のP値は二項分布の正規分布近似を使って作ったP値です。他にも漸近的に同値なP値の作り方が無数にある。 二項分布の正規分布近似を使って作ったP値は  特定の統計モデルにおいてデータの数値以上に極端な値が生成される確率 としてのP値の分かり易い例の1つになっています。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 データの数値「n回中k回当たり」に関する仮説「当たりが出る確率はpである」のP値の計算の仕方: 「当たりが出る確率はpである」の設定の二項分布を考える。 ②その二項分布は期待値np、分散np(1-p)の正規分布で近似される。 ③P値=その正規分布でnpからk以上離れた値が生成される確率 pic.twitter.com/LWKkvpC7Ii

黒木玄 Gen Kuroki@genkuroki

#統計 添付画像は、ルーレットを20回まわしたら当たりが5回出たというデータの数値に関する二項分布モデル+「当たりが出る確率はpである」という仮説のP値のグラフです。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値に関する誤解や誤用を11つ否定して行っても、根っこにある「楽にお墨付きを得たい」という欲望にタッチしていないので、モグラ叩きになってしまう。 P値単体では決して科学的お墨付きは得られない、とはっきり分かるように教育の仕方を変える必要がある。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 どうしてこういう補足を書いたのか? 統計学の応用時によく見られる病気にnullism, dichotomania, reificationがあります。 P値として「差がない」の型の帰無仮説のP値しか考えない傾向はnullismの症状の1つ。 nullismに誤誘導してしまわないようにこういう補足を書きました。

黒木玄 Gen Kuroki@genkuroki

#統計 パラメータRD, RR, ORを RD=p-q RR=p/q OR=(p/(1-p))/(q/(1-q)) とおいて、 仮説「RD=具体的な数値」のP値 仮説「RR=具体的な数値」のP値 仮説「OR=具体的な数値」のP値 も作ることができます。0<p,q<1のとき p=q⇔RD=0⇔RR=1⇔OR=1. RD, RR, ORはpとqの違いの異なる指標になっている。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 パラメータRD, RR, ORを RD=p-q RR=p/q OR=(p/(1-p))/(q/(1-q)) とおいて、 仮説「RD=具体的な数値」のP値 仮説「RR=具体的な数値」のP値 仮説「OR=具体的な数値」のP値 も作ることができます。0<p,q<1のとき p=q⇔RD=0⇔RR=1⇔OR=1. RD, RR, ORはpとqの違いの異なる指標になっている。

黒木玄 Gen Kuroki@genkuroki

#統計 例えば、2つの二項分布モデルBinomial(m, p)×Binomial(n, q)での「p=q」という仮説のP値を作りたいとき、pをp=qと設定してもqの値は決まりません。P値はqに依存しないように作る必要があります。 この問題の良い解答には、Pearsonのχ²検定の方法やFisher検定の方法などがあります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

このポストに関連してですが、経済学の実証分析(すなわち計量経済学の論文)において、自分の知る限り、P値関数を使用して、それが推定の1方法であると明確に語っている論文にいまだ遭遇していません。もしもそう語っている情報(論文)を教えていただければ嬉しい限りです。

Ilfan_Oh@Ilfan_Oh

メニューを開く

#統計 1つ上の投稿の内容は実質的に、有意水準α=0.05での帰無仮説「当たりが出る確率はp=1/2」の両側検定の話と同じです。 しかし、「棄却」のような強い言葉を使わずに「相性が悪い」と言っています。P値のみによる判断は危ないので、個人的には曖昧に響く「相性が悪い」の方が安全だと思います。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 仮にデータ取得前に決めておいた閾値α=0.05によって、P値がα以上なら相性が良い、α未満なら相性が悪いと2値的な判断をすることにしていたとする。 そのとき、p=1/2のP値は約0.025なので「当たりが出る確率は1/2」という仮説と「20回中5回」というデータの数値は相性が悪いと判断されます。 pic.twitter.com/Su9gyRb49c

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 別のよりくだけた言い方。 特定の統計モデルの下で、検定したい仮説が正しいのにP値<αとなる確率(この確率をαエラー率と呼ぶ)はおおよそαになる。 「αエラー」と「第1種の過誤」は同じ意味。 「おおよそαになる」を「α以下になる」のようにする場合もあります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 ASA声明 scholar.google.co.jp/scholar?cluste… の原則の1の"the data"は「観察データの数値」と翻訳して、原則の1の全体を P値は観察データの数値と特定の統計モデルの相性の良さの程度を表す と翻訳するとより分かりやすいと思う。 「観察データの数値」は確定した数値であり、確率変数ではない。

黒木玄 Gen Kuroki@genkuroki

#統計 ASA声明 scholar.google.co.jp/scholar?cluste… の原則の1: P-values can indicate how incompatible the data are with a specified statistical model. 値の大小関係を保つには"how compatible"(相性の良さ)とした方がよい。私訳: P値はデータと特定の統計モデルの相性の良さの程度を表す。 続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 ASA声明の原則の1的な (1) P値はデータと特定の統計モデルの相性の良さの程度を表す と伝統的説明の (2) P値は統計的有意差を出すために使われる は整合性を取ることが難しい。この点についてクリアに考えることは大事なことだと思います。私は(2)は明瞭に否定されるべきだと思っています。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計P値はデータと特定の統計モデルの相性の良さの程度を表す」というASA声明の原則の1的な説明を最初にすれば、有意水準αを設定した2値的判断と無関係にP値をどのように解釈すれば良いかが最初から明瞭になります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 ASA声明 scholar.google.co.jp/scholar?cluste… の原則の1: P-values can indicate how incompatible the data are with a specified statistical model. 値の大小関係を保つには"how compatible"(相性の良さ)とした方がよい。私訳: P値はデータと特定の統計モデルの相性の良さの程度を表す。 続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 両側P値<5%の条件で判断を下す場合には、テストする(対立)仮説達の中で実際に正しいものの割合が大雑把に半分程度以上になる状況で行うべき。 薬の治験は第1,2,3相の多段階になっており、最終の第3相試験の前までにそうなるように期待されているのだと思う。P値云々よりも制度全体が重要。

黒木玄 Gen Kuroki@genkuroki

#統計 テストする薬達の中での効く薬の割合pが50%ならば、有意水準5%(両側)の「危険率」の仮説検定で「効く」と判定された薬達の中での実際には効かない薬の割合は3%と小さめの値になる。 しかし、p=10%、5%、1%ならば同割合は22%、37%、76%と大きくなり、酷いことになります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

100万人以上に楽しんでもらえたみたいなので、あとで続きを。定義を踏まえ、まずざっくり解釈を言ってから順を追って、以下: ①p値的なもの、帰無仮説の考え方 ②有意水準とは恣意的なものである ③仮説検定の考え方 ④p値と"仮説が正しい"確率とは無縁である。 (教えるのって難しいんですよ...)

竹内幹@takekan

「p値」って何といわれて全く答えられない人に、計量経済入門の単位とか認定しちゃだめだよなあ、と思っている。 ざっくりいえば、p値(p-value)は「ある結論が、実はただの勘違いである可能性」と解釈できる。(小声でいうと、小さい方がうれしい) 例えば、学生グループAとBのテストの成績差。

竹内幹@takekan

メニューを開く

#統計 ちょっと面白いのは、Lehmann, Testing Statistical Hypothesesの第1版ではP値をcritical level (臨界水準)と呼んでいたこと。 第2版で、significance probability (有意確率)、p-value (P値)と呼ぶようになった。 NP流なので "how ~ contradict"と「矛盾」という強い言葉を使う傾向がある。 pic.twitter.com/cwz7tjZT0G

黒木玄 Gen Kuroki@genkuroki

#統計 Neyman-Pearson流の検定の定式化でのP値の定義の仕方については、Lehmann, Testing Statistical Hypotheses, 2nd edition, 1986のp.70を参照(添付画像1)。 1959年版ではp-valueとは呼んでなかった(添付画像2)。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 Welchのt検定の導出で使われるt統計量の定義式の分母の2乗が従う分布のχ²分布の定数倍による近似は、正規母集団の仮定からの逸脱について脆弱で一般にはうまく行きません。 しかし、自由度がmin(m-1, n-1)以上になるお陰でm,nが十分大きいならP値レベルでは正規母集団の仮定からの逸脱に頑健。 pic.twitter.com/w2oKEYfRBm

黒木玄 Gen Kuroki@genkuroki

#統計 Welchのt検定で使われる 正規母集団の仮定の下での(S_X)²/m+(S_Y)²/n の分布の自由度νのχ²分布のa倍による期待値と分散を揃える近似 は正規母集団の仮定からの逸脱に脆弱なのですが、使用するt分布の自由度はmin(m-1,n-1)以上になるので、m,nが大きいならP値のレベルでは頑健になります。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 例えば、正規分布モデルでの「母平均はμ=170である」という仮説のP値を作りたいとき、正規分布モデルのもう1つのパラメータσ²は任意のままで、σ²に依存しないようにP値を作る必要があります。 この問題の優れた解答が1標本t検定のP値の構成法です。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 例えば、モデルの確率分布がθとηの2つのパラメータを持つとき、仮説「θ=0」を検定で扱うときには、その設定の下でもう1つのパラメータηの値は「任意」ということになります。 しかし、仮説「θ=0」のP値はもう1つのパラメータηに依存せずに決まるように作る必要があります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 以下のリンク先スレッドには「t分布は単なるどんぶり勘定な補正としてのみ使われている」という立場で1標本t検定のP値関数を作るための粗筋が書かれています。 2標本の場合に同様にするとWelchのt検定が得られます。t分布による補正がなくてもそれなりに実用的なのでWelchのt検定は頑健になる。

黒木玄 Gen Kuroki@genkuroki

#統計 母平均の検定や区間推定に使えるP値の構成法 母集団分布を未知だが確定している母平均μを持つ分布p(xᵢ|μ,σ²,η₁,η₂,…)でモデル化する。σ²は母平均で、η₁,η₂,…は可能な分布の形状を「任意」にするための無限個のパラメータです。 続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値関数のグラフは高さαに信頼水準1-αの信頼区間の両端の点をプロットしても得られるので、信頼区間について知っている人にとってP値関数は真に新しい道具とは言えません。 しかし、実際にP値関数のグラフを見たことがあるか否かで、P値や信頼区間に関する理解度が変わる可能性は高いと思う。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 P値関数について biostat.ucdavis.edu/sites/g/files/… のスクショの添付画像にあるグラフが、P値関数のグラフです。高さαに信頼水準1-αの信頼区間の両端の点をプロットしても同じグラフが得られるので、P値関数は信頼区間関数と呼ばれることもあります。続く pic.twitter.com/AzbpoXxNED

黒木玄 Gen Kuroki@genkuroki

#統計 P値が最大になるaの値は差の点推定値になります。 P値が推定の道具でもあることは論文 scholar.google.co.jp/scholar?cluste… Rafi-Greenland 2020 にも分かるように書いてあるし、Greenlandさんのスライドにもあります。 biostat.ucdavis.edu/sites/g/files/…

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 1標本t検定のP値pvalue_ttest(x|μ)は、モデルの仮定の下での、データの数値xと「母平均はμである」という仮説の相性の良さの指標だと解釈される。 母平均の信頼水準1-αの信頼区間confint_ttest(x|α)は、閾値αによってデータの数値と相性が良いと判定されるμの値の範囲だと解釈される。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 nを大きくするとt分布TDist(n-1)は標準正規分布Normal(0, 1)で近似されるようになるので辻褄が合っている。 上のP値の定義で標準正規分布をt分布で置き換えることによって補正されたP値を定義する: pvalue_ttest(x|μ) = 2(1 - cdf(TDist(n-1), |t(μ)|)). これが1標本t検定のP値関数である。

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 しかし以上のP値は数値実験すると、nが十分大きいなら十分に機能するが、分布p(xᵢ|μ,σ²,η,η₂,…)がたとえ正規分布であったとしてもn=10程度では誤差が非常に大きくなることが分かる(αエラー率がαより酷く大きくなったりする)。 そこを上手に補正することを考えたい。続き

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 データの数値xでT(μ)中のXを置き換えて得られる値をt(μ)と書くとき、 pvalue_normal(x|μ) = 2(1 - cdf(Normal(0, 1), |t(μ)|)). これが正規分布近似版のP値関数です。信頼水準αのμの信頼区間は confint_normal(x|α) = { μ | pvalue_normal(x|μ)≥α } と定義される。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

#統計 母平均の検定や区間推定に使えるP値の構成法 母集団分布を未知だが確定している母平均μを持つ分布p(xᵢ|μ,σ²,η,η₂,…)でモデル化する。σ²は母平均で、η,η₂,…は可能な分布の形状を「任意」にするための無限個のパラメータです。 続く

黒木玄 Gen Kuroki@genkuroki

#統計 例えば、正規分布モデルp(x|μ,σ²)において母平均のモデルでの対応物のμに関する検定や区間推定を行えるようにしたい場合には、分散パラメータσ²によらないμだけの関数としてP値を作る必要があります。続く

黒木玄 Gen Kuroki@genkuroki

メニューを開く

返信先:@BB45_Coloradoこちらの書籍の1章にASA声明以降の統計解析指針について、2章にサリドマイド薬害を例に医療分野の統計利用について良くまとまっています。 初~中級者向けに有意水準検定の問題点とP値解釈の解説がされているので後付け検定的解釈”医クラ”の方たちに是非読んで欲しいですね。 honto.jp/netstore/pd-bo…

トレンド15:17更新

  1. 1

    エンタメ

    ドクター・キリコ

    • 優しい女神
    • ドクターキリコ
    • 原作改変
    • 夏木マリ
    • ブラックジャック
    • 安楽死
    • 森本レオ
    • コスプレ大会
    • 原作リスペクト
    • 高橋一生
  2. 2

    エンタメ

    キンキーブーツ

    • 東啓介
    • 松下優也
    • 有澤樟太郎
    • キャスト一新
    • 田村芽実
    • チャーリー
    • 甲斐翔真
    • 有澤
    • 新キャスト
  3. 3

    小林製薬

    • 小林製薬 万博
    • 紅麹問題
    • 小林製薬の
    • 健康被害
    • 5億円
    • 不適切だ
    • 取りやめ
  4. 4

    ITビジネス

    電気代補助

    • 年金生活者
    • 低所得世帯
    • 電気料金
    • トリガー条項発動
    • 電気代
    • 生活苦しい
  5. 5

    ニュース

    愛媛県中予

    • M4.4
    • M4.7
    • 茨城県沖
    • 132.7
    • 中予
    • 震度3
    • 津波の心配はありません
    • 地震情報
    • 震源の深さ
    • 最大震度3
    • 緊急地震速報
    • 中央構造線
    • 地震の規模
    • 地震速報
    • 震度2
  6. 6

    ハイパーストライクチェスター

    • プレミアムバンダイ
    • 120%
    • 情報解禁
    • 20周年
    • バンダイ
    • プレバン
  7. 7

    エンタメ

    日本デビュー曲

    • NewJeans
    • JAY
    • GLAY
    • 6億
    • MY FIRST STORY
    • 生出演
  8. 8

    ノリで入籍

    • 突然ですが
  9. 9

    アニメ・ゲーム

    うろジョジョ

    • 2009年
    • ジョジョ
    • 完結してない
  10. 10

    ニュース

    国家公務員法違反

    • 生活安全部長
    • 守秘義務違反
    • 情報漏えい
    • 本田尚志容疑者
    • 本田尚志
    • 国家公務員法
    • 内部文書
    • 南日本放送
    • 鹿児島県警
    • MBC
    • NHKニュース
20位まで見る

人気ポスト

よく使う路線を登録すると遅延情報をお知らせ Yahoo!リアルタイム検索アプリ
Yahoo!リアルタイム検索アプリ