ポスト

Diagnosis Pleaseの成績: ✅Claude 3 Opus (62%) >> GPT-4o (49.4%) >> Gemini 1.5 Pro (41%) (>>: 有意差) ✅Large language model (LLM)は結構【鑑別診断】でも正解してくる(最大で+8.4%) PMID:38954192 (大学院生の園田先生とco-first author) #Rdiag pic.twitter.com/1f6xXBU7Ag

メニューを開く

Ryo Kurokawa MD, PhD #Rdiag@Rdiag2

みんなのコメント

メニューを開く

【日進月歩】 3社のLLMのフラッグシップモデルを競わせる、という趣旨での ✅GPT-4o vs Claude 3 Opus vs Genini 1.5 Pro だったが、査読中に ✅Claude 3.5 Sonnet がリリースされ笑、別論文でSonnetの実力を追加調査中 #Rdiag

Ryo Kurokawa MD, PhD #Rdiag@Rdiag2

人気ポスト

もっと見る
Yahoo!リアルタイム検索アプリ