ポスト
大型言語モデル(LLM)のコード生成能力を評価する新たなベンチマーク「BigCodeBench」が発表されました。複雑なプログラミング課題を解決できるかどうかを評価するもので、LLMの課題解決能力を評価できると期待されます。#BigCodeBench #LLM #コード生成 #評価ベンチマーク huggingface.co/blog/leaderboa…
メニューを開く大型言語モデル(LLM)のコード生成能力を評価する新たなベンチマーク「BigCodeBench」が発表されました。複雑なプログラミング課題を解決できるかどうかを評価するもので、LLMの課題解決能力を評価できると期待されます。#BigCodeBench #LLM #コード生成 #評価ベンチマーク huggingface.co/blog/leaderboa…
メニューを開く