Самые ресурсоёмкие задачи сейчас, для чего закупают массово продукцию NVIDIA — это ML всякий (не знаю, правильно ли называю). Там не требуется такой кастомизируемости, какую дают FPGA. Там аналог этих fma (x + y * z) — это матричные операции похожей структуры. Так что нужна просто поддержка "в железе" этих вычислительных примитивов над матрицами. Она планируется через год примерно в наборе инструкций
AMX в архетектуре Sapphire Rapids.