Может не верно выразился, создается спарк сессия, в ней читают данные из оракла парсят в rdd, запихивают в словарь, закрывают сессию. Аналогично для хдфс, затем "ворочают" словари, для записи результата в оракл делают новую спарк сессию, пишут результат, закрывают сессию