"Как это mmx быстрее в 10 раз чем sse может быть то. Мож тогда лучше на mmx писать :) "
Да, действительно быстрее для Yonah (Intel Core Duo), и да - лучше, для этого процессора. К тому же, он дошёл только до SSE3, а вот SSE 3.1, SSE 4, SSE4.1, SSE 4.2 уже не поддерживает.
Я всё ещё ищу причину того, почему именно SSE на этом процессоре - медленный, но я думаю, что это:
Из-за узкой шины памяти, или автор просто написал кривой код.
Однако, по подтверждённым тестам Агнера Фога, для процессора Yonah (в твоём случае) - MMX действительно намного быстрее, чем SSE.
Я отобрал по 5 инструкций из каждого:
movd r32, mm = 1
movd mm, r32 = 1
movd mm, m32 = 1
movd m32, mm = 1
movd r32, xmm = 1
movaps/d xmm, xmm = 1
movaps/d xmm, m128 = 2
movaps/d m128, xmm = 3
movups/d xmm, m128 = 2
movups/d m128, xmm = 3
MMX всегда занимает 1 такт для этого процессора. SSE - 2-3
P.S: Насчёт "в 10 раз" не уверен. Опять же - автор что-то напутал, но то, что быстрее - правда