ポスト

おそらく数年後、一家に一台フォンノイマンの時代へ。 音声認識はもうサチった印象を受けたので、あとは画像認識。

メニューを開く
つかじか@aQUOKS2ZUegE96b

GPT-4oの画像認識能力について。 スクリーンショットを渡して、「Temperatureという文字列のTという文字の座標を教えて」と頼んだところ、右上のPresetsという薄い文字の下の方の座標を提示。 画像認識はまだ成長分野。 逆にUIを理解したとき、もうそれはただの目の疲れないフォンノイマンですね。

つかじか@aQUOKS2ZUegE96b

Yahoo!リアルタイム検索アプリ