- すべて
- 画像・動画
並べ替え:新着順
2024/07/07第61回CV勉強会@関東「CVPR2024読み会」(前編) - takminの書きっぱなし備忘録 @はてなブログ takmin.hatenablog.com/entry/2024/07/… #cvsaisentan
本日の #cvsaisentan at LINEヤフー、楽しかったよーって方は次回の後編もぜひ参加登録してください🤗 #MIRU2024 直前でもあるので前夜祭やりましょう! 第61回 コンピュータビジョン勉強会@関東(後編) kantocv.connpass.com/event/321175 #cvsaisentan
本当にこのような会を開催していただき感謝です。ありがとうございました!とてもとても楽しかったです。 田舎に住んでいますので、次からはオンラインの参加になりますが、よろしくお願いいたします!(オンライン配信も本当に感謝です #cvsaisentan
必ずしもリッチなOCRアノテーションが文書のすべてについてる必要はないのかな?Instruction Tuningに対応するものだけアノテーションしたデータがあれば十分? #cvsaisentan
9人目の発表は ykamikawa ( @ykam1kawa )さんで、タイトルは LayoutLLM: Layout Instruction Tuning with Large Language Models for Document Understanding 発表資料は以下をご確認ください。 x.com/ykam1kawa/stat… #cvsaisentan
本日のCVPR2024読み会の発表資料「LayoutLLM: Layout Instruction Turning with Large Language Models for Document Understanding」をアップロードしました。 speakerdeck.com/ykamikawa/layo… #cvsaisentan
BioCLIPのTaxonomic Labels(テキスト)は一般的なテキストのような表記ゆれがないのがポイントという感想。ちゃんとしたアノテーションがついてればCLIPでも階層構造をしっかり捉えられるというのが知れたのは良い知見だ・・・ #cvsaisentan
8人目の発表は Godel (@___Godel)さんでタイトルは Navigation & SLAM @CVPR2024 と題して2本の論文をご紹介いただきます。発表資料は以下をご確認ください。 speakerdeck.com/godel/navigati… #cvsaisentan
精度的な目安は分からないけれども、使用例は、例えばユーザから収集した画像の中に絶滅したはずの動物の写真が紛れていて、この画像認識モデルによってそれがもし見つけられたら、その情報は学術的な価値がすごく高くなり、そういう研究してる人の役に立つみたいなことはありますね。 #cvsaisentan