По скорости любой из вариантов может быть и более быстрым в одном случае и более медленным в другом.
То есть прямая работа с железом из машинного кода после C++ без VM может быть медленнее и прожорливее, чем на байткоде Java, читаемом тридцатимегабайтной JWM? Интересное кино...