- すべて
- 画像・動画
自動更新
並べ替え:新着順
メニューを開く![](https://rts-pctr.c.yimg.jp/BgIFgYJGVIVv8u0nVJvw8B2FauAYMF4jOP5zFJAV4i5e72TLbER0xQeK1l8ZZ0OLKQjxa3CER38uPu1JRh0_CqhiSrZc2bs1I38gNXNq-D2Ll4SgmqjAuA7MecfGvYetc1TXXy-ZeDmEktvy1qXUjLM2YlpHB-Wgo7-eqnitYK36q3MOm65yfaMLbBMd2r42zHnvk4PqjpOYCnT8217t0bO6IDf5bkfM62Jubk_oIaM=)
メニューを開く![](https://rts-pctr.c.yimg.jp/BgIFgYJGVIVv8u0nVJvw8B2FauAYMF4jOP5zFJAV4i5e72TLbER0xQeK1l8ZZ0OLn3SvJugerOWF9GWyWs8jemX-jidNwM_65gIMy1CukCfjm4_DW9ya7LX72-WQt1fi5K1XOO3UIScNZN2v8kvsNnuznc8_Gl8av8I8pR8AMt73As9BXx0LZMh7ju87AOOXN5ax1NIL0Ru3g6ywksHDsUJTZGjdk_qNLylFHXro41s=)
返信先:@horiaustin前のearning callでscaling lawを確認しているって言ってましたね 推測ですけど12.4, 12.5, 12.6はscaling lawで損失が例えば1/2になるようにデータを増やして再学習 12.4.x みたいなマイナーチェンジは苦手な状況とかを重点的にLoRAとかで追加学習して微調整してるのかなって思ってます
並べ替え:新着順
返信先:@horiaustin前のearning callでscaling lawを確認しているって言ってましたね 推測ですけど12.4, 12.5, 12.6はscaling lawで損失が例えば1/2になるようにデータを増やして再学習 12.4.x みたいなマイナーチェンジは苦手な状況とかを重点的にLoRAとかで追加学習して微調整してるのかなって思ってます