ポスト

LLMTranslatorに、translatorインスタンス単位で専用のkv cacheを保持する仕組みを入れたくなってきたのだけど、llama.cpp serverの現在の実装だと、「現在どのキャシュファイルをロードした状態であるか」をサーバーに問い合わせても分からない気がしてる。どうするのがいいのかなあ。…

メニューを開く

mutaguchi@mutaguchi

みんなのコメント

メニューを開く

やっぱりkv cacheのファイルへのexport/importだけではしんどいな。named cacheの機構が必要なのでは。…

mutaguchi@mutaguchi

人気ポスト

もっと見る
Yahoo!リアルタイム検索アプリ