ポスト

LLMのモデル作成には時間がかかるので、様々なエラーから回復する手段(チェックポイントリスタートなど)をクラスタやスケジューラに持たせている。ちなみにPhi-3の学習でも2日以上かかる pic.twitter.com/9aoFs3ELU7

メニューを開く

Toru Makabe@tmak_tw

みんなのコメント

メニューを開く

ファインチューニングしたモデルをそれぞれ動かすのは無駄が多い。そこで、ベースモデルと差分で動かせるLoRAを開発 pic.twitter.com/S9xTOPxzjv

Toru Makabe@tmak_tw

人気ポスト

もっと見る
Yahoo!リアルタイム検索アプリ