Дебильность в том, что не получается раскидать репартишеном так, чтоб не попадало несколько ключей в одну партицию, потому что какой у них хэш по модулю будет - не угадаешь
/** * A dummy partitioner for use with records whose partition ids have been pre-computed (i.e. for * use on RDDs of (Int, Row) pairs where the Int is a partition id in the expected range). */ private class PartitionIdPassthrough(override val numPartitions: Int) extends Partitioner { override def getPartition(key: Any): Int = key.asInstanceOf[Int] }