Оказывается всё-таки можно закидывать числа в регистры FPU (ST0-ST7) не только из памяти, но и сразу с регистра RAX и т.п., правда от того что в 80-ти битный регистр прилетит 64 бита — толку мало, к тому же старшие 16 бит регистра ST, при этом, установятся в 1.
С другой стороны, если для каких-то целей достаточно младших 64 бит из ST, то их напрямую можно положить в тот же RAX
но это не вяжется со сказанным здесь. говоришь про fpu, а используешь mmx