- すべて
- 画像・動画
並べ替え:新着順
返信先:@abonst1009他1人#統計 P値はデータの数値とモデルのcompatibilityの程度を表すに過ぎず、データの数値と現実の関係を直接には与えない。 信頼区間も、閾値αによってcompatible, incompatibleに二分するときのデータの数値とcompatibleなモデルのパラメータの範囲を意味するに過ぎず、現実の話とは直接関係しない。
返信先:@abonst1009他1人そこを理解できていないと、「P値はデータの数値と特定の統計モデルがどの程度compatibleであるかを表す」というASA声明の原則1も理解できなくなります。 信頼区間はP値≥αとなるモデルのパラメータの値の範囲なので、ASA声明の原則1に従って解釈されます。
#統計 有意水準α=5%=信頼水準1-α=95%の信頼区間は 閾値αでデータの数値と相性が良いとみなされるパラメータδの範囲 になります。添付画像の橙色の横線が片側検定に対応する95%信頼区間です。 相性の良し悪しはP値≥αの成否で判断されるちいうルール。続く pic.twitter.com/fm7B8R5n6V
#統計 一般に信頼水準1-αの信頼区間は「P値≥αとなるパラメータの値の範囲」になります。 帰無仮説Δμ:=μ₁-μ₂≤0のP値p₀はグラフではδ=0のP値です。P値はδについて単調増加なので、「P値≥p₀となるパラメータの値の範囲」は自明に0以上の実数全体になります。 自明! github.com/genkuroki/publ… pic.twitter.com/SK48oRIRJC
#統計 P値は、αエラー率に関する基本要請(P0)を満たしていてかつ、データの数値とモデルとパラメータの値の設定の相性の良さの指標になっている という説明は、信頼区間とP値の表裏一体性(信頼区間はθ=aのP値≥αとなるaに範囲)を通して、信頼区間の解釈が難しいという問題も解決しています。 x.com/genkuroki/stat…
#統計 P値については、 基本要請(P0)を満たしていてかつ、データの数値とモデルとθ=aという設定(検定したい仮説)の相性の良さの程度に見えるもの と理解しておけば、その構成法の詳細は忘れてもそう困らないと思う。そして上で述べた方法であ基本要請(C0)を満たす信頼区間もP値から作れる。 x.com/genkuroki/stat…
#統計 反対意見も合理的になり得ることを承知で個人的な意見を言うと、棄却領域による定式化は中途半端で欠点が多いと思います。 * 検定関数まで解の範囲を広げないと所謂UMPU検定が存在しない場合が出てくる。 * P値関数と違って、棄却領域で教えると、科学的に有害な2値的判断が強調されてしまう。 x.com/genkuroki/stat…
#統計 #数楽 検定法の定式化には * P値関数 * 棄却領域 * 検定関数 (値は棄却確率) がある。 検定法のNeyman-Pearson的最適化では検定関数による定式化が優れています。しかし、確率的に棄却したりしなかったりする検定法になる場合があるので、最適化の結果は実践的には使えない場合がある。 x.com/genkuroki/stat…
#統計 横軸をパラメータに取ったP値のグラフは、点推定値と区間推定の結果(信頼区間)の情報を含みます。「相性の良さ」(compatibility)による解釈の下で信頼区間は 閾値αによってデータの数値と相性が良いとみなされるパラメータの値の範囲 (良相性区間、compatibility interval) だと解釈されます。 x.com/genkuroki/stat…
#統計 添付画像はデータの数値が「20回中6回」の場合のP値のグラフです。 分かり易さのために、点推定と区間推定(信頼区間)も描き込んであります。 P値はこのように推定の道具でもあるのです。 nbviewer.org/github/genkuro… pic.twitter.com/jYlCFBL8Pu
#統計 「母比率の差はゼロ」というゼロ仮説のP値は、少なくとも3通りの方法で「母比率の違いはaである」の形の仮説のP値に拡張されます。 そのように拡張すると、P値≥αとなるRD, RR, ORの値の範囲として、RD, RR, ORの信頼区間も得られます。 それらのP値関数が2×2の分割表の統計学の基礎になる。
#統計 パラメータRD, RR, ORを RD=p-q RR=p/q OR=(p/(1-p))/(q/(1-q)) とおいて、 仮説「RD=具体的な数値」のP値 仮説「RR=具体的な数値」のP値 仮説「OR=具体的な数値」のP値 も作ることができます。0<p,q<1のとき p=q⇔RD=0⇔RR=1⇔OR=1. RD, RR, ORはpとqの違いの異なる指標になっている。
#統計 添付画像のようにP値関数のグラフを描けば、閾値αを設定しなくても、視覚的にデータの数値との相性が悪すぎないパラメータpの範囲は分かります。 閾値αの設定による人為的2値的判断は無理してやる必要はない。 pic.twitter.com/3MxB0zMKX4
#統計 閾値αを使った相性の良し悪しの判断によって信頼区間も定義されます。 P値がα以上になるpの値の範囲 すなわち 閾値αでデータの数値との相性が良いとみなされるpの値の範囲 を信頼区間と呼びます。Greenlandさん達はcompatibility区間と呼ぶべきだと言っています。 pic.twitter.com/Gip3Kh4ue5
#統計 P値は背景となるモデルの下でのデータの数値とパラメータの値の相性の良さの指標でした。 信頼水準1-αの信頼区間は「P値≥αとなるパラメータの値の範囲」なので、「閾値αの設定によってデータの数値と相性が良いと判定されたパラメータの範囲」だと解釈されます。 scholar.google.co.jp/scholar?cluste… pic.twitter.com/R7MVEZzoBO
返信先:@con_advancing#統計 * 有意水準α(信頼水準=1-α)も設定していない。(設定したい人は設定できる。設定すれば、P値≥αを満たすパラメータの値の範囲として信頼区間も得られる。) * パラメータの設定値を横軸にP値を縦軸に取ったグラフを描いて、様々な事柄を直観的に扱った。