ポスト

崩し字は単なる変形でなく、意味的連続性を保ちながら時間軸を経た多段階のスタイル変容の結果であること、崩し字単体の情報に加えて文脈から補完した文意とともに楷書を推測してるだろうことを踏まえると、手書き文字のOCRには、LLMが文脈から適した出力を選ぶような構造が当てはまる気がする。

メニューを開く

あざらし@kintone@moduloseal

みんなのコメント

メニューを開く

というのが突然脳裏に湧きだしてきて少し調べると、Vision-Language Models(VLMs)という領域があるらしいことを知るなど。 note.com/npaka/n/n76fb2…

あざらし@kintone@moduloseal

人気ポスト

もっと見る
Yahoo!リアルタイム検索アプリ