ポスト
BM25とハイブリッドしてるところも多く、その全文検索で固有表現登録すれば良い。そこの使い勝手も含めて、ElasticSearchやOpenSearchはembiddingでの検索サポートしてたりする
メニューを開くMitarashi@mitarashiponta
とある専門分野で、Embedding モデルがあまり学習してないキーワードをRAGしようとしたとき同じ問題にハマった経験あります。結局キーワード抽出した後全文検索で情報引っ張ってくるのが一番精度高かったです😇
BM25とハイブリッドしてるところも多く、その全文検索で固有表現登録すれば良い。そこの使い勝手も含めて、ElasticSearchやOpenSearchはembiddingでの検索サポートしてたりする
メニューを開くとある専門分野で、Embedding モデルがあまり学習してないキーワードをRAGしようとしたとき同じ問題にハマった経験あります。結局キーワード抽出した後全文検索で情報引っ張ってくるのが一番精度高かったです😇