- すべて
- 画像・動画
自動更新
並べ替え:新着順
メニューを開く
大型言語モデル(LLM)のコード生成能力を評価する新たなベンチマーク「BigCodeBench」が発表されました。複雑なプログラミング課題を解決できるかどうかを評価するもので、LLMの課題解決能力を評価できると期待されます。#BigCodeBench #LLM #コード生成 #評価ベンチマーク huggingface.co/blog/leaderboa…
並べ替え:新着順
大型言語モデル(LLM)のコード生成能力を評価する新たなベンチマーク「BigCodeBench」が発表されました。複雑なプログラミング課題を解決できるかどうかを評価するもので、LLMの課題解決能力を評価できると期待されます。#BigCodeBench #LLM #コード生成 #評価ベンチマーク huggingface.co/blog/leaderboa…