ポスト

gccもclangも短い定数をmemcpyすると、 mov (定数), reg mov reg, (mem) movl imm, (mem) みたいに変換してて賢い。 SSEで書くとさらに速いようだ。 movaps (定数置き場), xmm movups xmm, (mem) clangは素直に置くが、gccはmovupsを一か所に固めようとして遅くなる。最適化ってムズイね……。

メニューを開く

Katsuhiro Suzuki@ksattkb

Yahoo!リアルタイム検索アプリ