Ну вот вот из "невелосипедов":
1) sqoop
2) hive (коннекторы ко всему что только можно)
3) spark
Любое из решений можно скрестить для окрестрации и скедулинга
1) airflow (пишем описание на python)
2) oozie (xml, можно как квадратики в hue накидать, так и выгенерить откуда)
3) Pentaho