Телеграмм чат группы ChatAssembler страница 3987

21:34пожаловаться #1

Дмитрий in Ассемблер

Само не напишется, нужно приложить немного усилий. 1. Ознакомиться с системой команд 8051. 2. Распечатать схемы стенда и системы команд, чтобы перед глазами были. 3. Уяснить задание! 4. Разработать алгоритм. 5. Написать софт. Усё 🙌

21:36пожаловаться #2

Den in Ассемблер

а, да, действительно пропустил про bcd вот так по диагонали нельзя конечно такие книжки читать :)

21:37пожаловаться #3

Den in Ассемблер

я про использование bcd формата только в mmx регистрах где то вроде читал, а так не использовал, асмовские комманды основные же типа div mul вроде такого формата не поддерживают? ну если не по одной цифре да и то с оговорками

21:46пожаловаться #4

Den in Ассемблер

и всеравно у него ошибка, двоичный вариант у него 11 :) а BCD тогда правильно

21:48пожаловаться #5

disba1ancer in Ассемблер

Скорее всего, им просто было лень для этого вводить инструкцию и пилить под неё логику, или посчитали, что это не очень нужно

22:27пожаловаться #6

не там, какие-то другие траблы были

22:28пожаловаться #7

(сорян ща не вспомню что именно)

22:28пожаловаться #8

АШ

Алексей Шведов... in Ассемблер

Кто писал методы Run PE in Memory на ассемблере?
Хочу посмотреть реализацию

22:37пожаловаться #9

есть для флоатов 32битные регистры? чтобы одинарную "флоат*флоат" операцию провести

22:54пожаловаться #10

если их в GPRки закинуть, то они как целые числа перемножатся

22:54пожаловаться #11

Можно точность в control word выставить, можно через SSE считать.

23:17пожаловаться #12

SSE для флоат*флоат маленько перебор - там оверхед для такой простой операции большой
а как первое делать?

23:18пожаловаться #13

push    eax ; Можно отдельную переменную выделить.
fstcw   word[esp]
and     word[esp],not 0x300
fldcw   word[esp]
pop     eax

А зачем это нужно вообще?

23:23пожаловаться #14

считаю

a[i]  =b[i]*alpha + a[i]

23:23пожаловаться #15

Такое самое то пачками через SSE считать!

23:27пожаловаться #16

именно

23:28пожаловаться #17

я сейчас пытаюсь оптимизировать те случаи, когда в массивах по 3 флоата и меньше и дошел до этого :

movss xmm0, [rsp] //alpha

second:

  movss xmm1, [rsi + rcx] //x[i]

  mulss xmm1, xmm0 //alpha * x[i]

  movss xmm2, [rdx + rcx] //y[i]
  addss xmm1, xmm2 //alpha * x[i] + y[i]

  movss [rdx + rcx], xmm1 //new y[i]

  add rcx, 4
  cmp rcx, rax
  jl second

этот код можно еще лучше оптимизировать? или все, это предел?

23:29пожаловаться #18

asm in Ассемблер

Добро пожаловать ♦️♠️ilindermin♣️♦️. Не ответив на вопрос, будешь удалён из чата

23:34пожаловаться #19

Ну разве что убрать второй по счёту movss (дальше тебе значение не нужно, а addss сам умеет с памятью работать) и развернуть цикл (сдублировать вот эти операции и проверку, но прыгать не назад, а вперёд, к концу). Но я не уверен, сделай бенчмарк и попробуй.