ポスト

ピックアップそのに アプリの推薦システムでは、Embedding x Vector 検索を利用しています。Vector 特化型ストアの選択肢もありつつ、今回のケースでは pgvector で実用に耐えうると判断し、Aurora PostgreSQL と pgvector でマッチングを行っています。マッチング結果はRAGに利用します。 pic.twitter.com/qynmS21Yvg

メニューを開く

Takahiro Ikeuchi / Awarefy CTO@iktakahiro

みんなのコメント

メニューを開く

ピックアップそのさん 上記に加えて、生成AI のエンドポイントの冗長化構成をとっています。同一モデルで冗長化構成が組めない場合はフェールソフトも覚悟に、とにかく全体が停止しないことを目指します。 pic.twitter.com/kfbMTKWNzp

Takahiro Ikeuchi / Awarefy CTO@iktakahiro

人気ポスト

もっと見る
Yahoo!リアルタイム検索アプリ