Главным образом от того, что делает приложение. Скорее всего в jmeter они будут активно выделять/освобождать память, так что упрешься в gc и сделать с этим что-то сложно - даже быстрые современные сборщики вроде shenandoah/zgc вынуждены останавливать мир чтобы помаркать системные объекты вроде тех же тредов. Чем их больше - тем больше паузы, чем больше пауза gc - тем больше она портит результаты теста. Начиная с какого-то момента будешь мерять больше потроха jmeter и java, чем систему.
История неуспеха: 10k тредов с websocket сэмплером делали вид, что живут, 15k разносили jmeter.