ポスト

M3では行列サイズが400を超えるとMETALFlashAttentionよりMPSのほうが速度が出るって。 内部変更があって、FlashAttentionが速度が出なくなっていてMPSは最適化が進んでいる状況。 M3 Performance github.com/philipturner/m…

メニューを開く

市川雄二@y_ich2

人気ポスト

もっと見る
Yahoo!リアルタイム検索アプリ