Все-таки broadcast (hash) join и другие оптимзации это только оптимизации. А фолбек всегда идет в sorted merge join. Как наиболее универсальный алгоритм.
Ну и отдельно, кажется что делать трешолд по размеру автоматически - не лучшая идея. Кластеры разные, ноды разные, запросы разные.