- すべて
- 画像・動画
並べ替え:新着順
#統計 P値を対数スケールのS値=-log₂(P値)で見ることには、P値の違いの大きさを適切に把握するために必要なことです。 80%と40%の違いは、8%と4%の違いと同等で、どちらも1ビットしか違わない。1つのYes/No questionの回答が持つ情報量の分しか違わない。 biostat.ucdavis.edu/sites/g/files/… pic.x.com/YsnXnjZm6Q x.com/genkuroki/stat…
#統計 P値は対数スケールで見た方が誤解が減るかもしれないという話もあります。S値 S値 = -log₂ P値 (単位はbit) とおいて、P値の違いの大きさは、S値の差の大きさで測ると良いです。 80%のP値と40%のP値の違いは1bitに過ぎず、8%のP値と4%のP値の1bitの違いに等しい。 biostat.ucdavis.edu/sites/g/files/… pic.x.com/9ui1NcUnFL
調査について: ・テンション下げ攻撃(*)を受けた回数は前から、 15,23,12,1 → 合計51回 ・1回以上ためてテンションを下げられたの回数をカウント。つまり(*)は確実に効く想定 ・願いの丘地下、くさった死体3匹エンカウントで調査 ・等確率を仮定するとP値<0.001。普通ならP>0.1。自由度3のカイ2乗
これ典型的な適合度の検定に当てはまるじゃん。帰無仮説「高市氏と石破氏の応援効果は同じ」のカイ2二乗検定は統計量7.32(自由度1)でp値0.0068。有意水準1%の検定で仮説棄却でデータは高市さんが応援した方が効果高いことを示唆。無作為ではない訪問先選定過程は考慮せず+計算間違い(ChatGPT)に注意 x.com/tweet_tokyo_we…
FLASH『高市早苗氏、衆院選で40カ所応援行脚も「落選率60%」威光示せず』⇒ 石破茂首相の応援行脚は「13勝63敗」で「落選率82%」 anonymous-post.mobi/archives/54319
お゛ぉ゛ぉ゛ぉ゛…このタイミングで統計解析ソフトのバグがぁぁぁ… 応答曲面法の変数選択において、説明変数の有意性を示すP値(上側)が、1つの説明変数だけ表示されないとか無いでしょぉぉぉよぉぉぉぉ _(:3」∠)__(:3」∠)__(:3」∠)_
【今日の1日1スキル👩💼】DS-50 科学的解析の基礎 - 推定・検定 ⭐️⭐️ 🔥必須🔥 p値だけでは仮説やモデルの正しさを評価できないことを理解し、p値以外のアプローチ(信頼区間、信用区間、ベイズファクターなど)と併せて透明性の高いデータ分析や結果の報告ができる
#統計 テスト用の2つの仮想的母集団分布がどちらもInverseGamma(10,1)で、無変換(identity)と逆数変換(inv)の後のP値の小さい方を採用すると、添付画像のようにαエラー率が上昇します。 github.com/genkuroki/publ… pic.x.com/v5qBHOMDSp
#統計 母集団分布がどちらもGamma(4,1)の場合に、無変換と対数変換の両方のP値の小さい方を使ったときの、名目有意水準5%でのαエラー率は添付画像のようになります。 不等標本サイズになるほどαエラー率の上昇幅は大きくなります。続く github.com/genkuroki/publ… pic.x.com/CJNzEuajbz
返信先:@neko_stats#統計 否定したい特定の帰無仮説のP値単体ではなく、無数の検定仮説のP値全体(P値関数)を扱ったり、閾値αを固定せずに100(1-α)%信頼区間全体を扱ったりすることは、よく知られていないので、簡単な解説を作りました。 ↓ nbviewer.org/github/genkuro… これを見れば「検定法=区間推定法」だと分かります。 x.com/genkuroki/stat…
#統計 バージョンアップ P値関数に至る道を具体例で説明 データの数値「n=20回中5回成功」が得られたときに、報告内容の制限を外して行くと、自然にP値関数の報告というアイデアに到達する。 添付画像はP値経路。続く github.com/genkuroki/publ… pic.x.com/WRCmS8KsxR x.com/genkuroki/stat…
モデルと観測に基づくものだから、当然そんな指標ではない(と自分は理解している) こういう誤解を阻むためには以前どこかでみた「p値はモデル選択のための指標・基準である」という説明が自分のする中では1番有用に思う
【マリオで学ぶ統計学】 ほとんどの姫は一生にさらわれる回数は0-1回 ↓ たまたま推しの姫が14回さらわれる ↓ マリオ「そうはならんやろ」 「そうはならん」度数がP値 P値 <0.05なら、たまたまではない
返信先:@Poswith1value pvalue_m 0.999 <- 1 = "> 0.999" other =[Pvalue5.3]; run; p値は1とらんからってやつですよね。下限は備え付けのものに入ってるのであとは上側だけたして 以下のイメージであってますかね? pic.x.com/PahSNx3DRP
◯◯の8割は知らないタグよく見るが8:2の比で設定されているのが興味深い🤔(正規分布1σは68.3%やから 科学的にはこうだは直接の証明でなくてその反対が成立しないことを統計的に確認ということをする(これを主張するにはこれと反対のことを否定する。t検定だとp値が0.05あるかどうか) つまり疲れた🥱☕️
友情出演的に分析を手伝った論文の査読が返ってきた。 Reviewer 1: Minor Revision Reviewer 2: Minor Revision 明らかに不要な文脈で「p値を出せ」と言われたが、不要であることは承知の上で、軽く書き足しておこう。
#統計 ベイズ統計での事後確率とP値の近似的一致の例の追加2-1 gri.jp/media/entry/398 github.com/genkuroki/publ… pic.x.com/v5zuSpG7mi x.com/bob3bob3/statu…
#統計 ベイズ統計での事後確率とP値の近似的一致の例の追加1 qiita.com/perico_v1/item… github.com/genkuroki/publ… pic.x.com/73FARZSRMu x.com/bob3bob3/statu…
学部1年生にGEO2R ncbi.nlm.nih.gov/geo/geo2r/ で発現差がある遺伝子をみつけろという課題をだしたんだけど滅茶苦茶な分割(例えばレプリケートを2分割)でも補正P値が0.05以下になる遺伝子は結構見つかってしまうので偽陽性避けるのは難しいんだなー、と改めて実感している。
#統計 P値はパラメータの値の設定とデータの数値の相性の良さを表す指標の1つに過ぎません。 パラメータ (a, p) の値の設定とデータの数値の相性の良さは添付画像のようにプロットされることになります。 P値の本来の姿はこのように見て楽しめる複雑さになります。 x.com/genkuroki/stat… pic.x.com/uM7ysfN2jK
#統計 お勧めのGreenlandさんの講演スライドより P値を推定のための道具として扱わない誤りの繰り返しはやめるべき。 「差がない」という帰無仮説のnull P値単体を帰無仮説有意性検定(NHST)で使うだけなのは誤解の主な原因になっている。 biostatistics.ucdavis.edu/sites/g/files/… pic.x.com/ey1p8K9W3D x.com/genkuroki/stat…
#統計 α=1.0の曲線(最も色が濃い茶色で表されている曲線)はaまたはpを固定したときに得られるpまたはaの点推定値を表しています。 もしくは、データの数値と相性がもっともよいaとpの組み合わせ全体を表している。 P値で色を付けています。 github.com/genkuroki/publ… pic.x.com/O2sxupjeb8
#統計 95%信頼領域、99%信頼領域、P値関数のヒートマップを比較するために3枚まとめて投稿してみる。 個人的には、ナマのヒートマップ(3枚目)よりも、5%や1%の人為的な(科学的必然性皆無の)閾値設定の影響が見える1枚目と2枚目のグラフの方が3枚目よりも好みかも。 github.com/genkuroki/publ… pic.x.com/jg3WrKjYo4
#統計 続き 添付画像は上の投稿のデータの数値の場合のp=1/2の場合(XとY+aが互角になる場合)に制限したハンデaに関するP値関数のグラフです。 今回はMann-WhitneyのU検定のP値関数も同時プロットしています。BM検定のP値関数よりも幅が狭くなっている。続く github.com/genkuroki/publ… pic.x.com/XP8tmMJsBQ
#統計 BM検定に付随する(a,p)の信頼領域の例3/3 上では「互角」を仮定していたので、p=1/2と設定されていた。pの値も動かしたときのP値≥5%の領域に色を付けてプロットしたものが添付画像のグラフである。 これはBrunner-Munzel検定に付随する95%信頼領域の具体例。 github.com/genkuroki/publ… pic.x.com/rTeJRh9Swj
"p値ベースの分析結果の1/3が偽陽性" みんなうっすらと知ってた x.com/shunk031/statu…
「p値って何かわかりますか??」からの「p値ベースの分析結果の1/3が偽陽性です」 インパクトすごいなこの論文 False Positives in A/B Tests | Proceedings of the 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining dl.acm.org/doi/10.1145/36… #kdd24_reading pic.x.com/UTThvrM3fR
「p値って何かわかりますか??」からの「p値ベースの分析結果の1/3が偽陽性です」 インパクトすごいなこの論文 False Positives in A/B Tests | Proceedings of the 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining dl.acm.org/doi/10.1145/36… #kdd24_reading pic.x.com/UTThvrM3fR
#統計 添付画像は、下川敏雄氏の講義スライドp.10 waidai-csc.jp/updata/2023/08… とほぼ同じ設定で、平均が等しい2つの正規分布について標準偏差の比s₂/s₁を変えながら、P値<5%となる確率を計算した結果です。 MW=Mann-WhitneyのU検定ではその確率が大きく上昇しています。続く github.com/genkuroki/publ… pic.x.com/lG4Lm2FSPV
#統計 添付画像は、母集団分布1,2がそれぞれ平均が0で標準偏差が1,4の正規分布の場合の(不等母分散の場合の)、Student, Welchのt検定、Mann-WhitneyのU検定、Brunner-Munzel検定でのP値がα以下になる確率(αに近い方が良い)のグラフです。続く github.com/genkuroki/publ… pic.x.com/HWcMFlVQ8w
>ベクトルの次元が高くなるにつれ、0に近い値ばかり出るようになって、1や-1に近い値が出にくくなる >「値1−α=1−P値」が大きければ大きいほど、「母相関係数(あるいはその絶対値)は大きかろう」といえることになるわけです。これを「直交非尤度」とでも呼びましょう。 天才かこいつ…
#統計 doi.org/10.3758/s13428… 翻訳引用【NHSTを使用しているすべての出版された心理学論文の半数に、検定統計量および自由度と一致しないp値が少なくとも1つ含まれていることがわかった。8つの論文のうち1つには、統計的結論に影響を与えた可能性のある著しく矛盾したp値が含まれていました。】
某社MRが「有意差があります!!」と持ってくるゾコーバのRCT。 軽症COVID19に対するゾコーバ (ensitrelvir) はプラセボと比較し主要5症状の消失が1日早い (p=0.4)とのこと。 効果はわずかであり、さらにサンプルサイズ各群230例でサンプル数各群340例とp値警察に処されそうなαエラーである。 さて.. pic.x.com/JCrY1xRQw8
#統計 ①有意水準を例えば5%に設定して「P値<5%」かどうかのみを報告すると、多くの場合に科学的に無意味な有意水準の設定が必須になってしまうし、危険な二分法も強制されてしまう。 ②P値の具体的数値を「P値=2.5%」のように報告するなら、有意水準の設定は必須ではなくなる。 続く pic.x.com/PYkQcX8JrN x.com/genkuroki/stat…
#統計 バージョンアップ P値関数に至る道を具体例で説明 データの数値「n=20回中5回成功」が得られたときに、報告内容の制限を外して行くと、自然にP値関数の報告というアイデアに到達する。 添付画像はP値経路。続く github.com/genkuroki/publ… pic.x.com/WRCmS8KsxR x.com/genkuroki/stat…