Да, презентация по последней ссылке скучноватая. Выглядит, как попытка урвать себе немного от общей моды на построение аппаратных ускорителей в области ML по методике codesign. Я бы сказал, что вышеупомянутая "фишка" слабо смотрится на фоне систолических TPU. Скорее, они упирают на мультикомпьютерное решение, с крупными узлами (1 Mb SRAM) вместе с "NoC is visible to computer". Последняя фраза звучит шокирующе для тех, кто привык к настольным архитектурам, а в специализированных решениях это давно рутинная вещь.