В целом, в Zeppelin, в интерпретаторе Spark, в пункте spark.jars (Comma-separated list of jars to include on the driver and executor classpaths. Globs are allowed.) добавила строку /Users/username/Programms/spark_packages/postgresql-42.2.11.jar, и сохранила
Всем привет, подскажите пожалуйста, в каком облачном решении будет удобнее развернуть spark-standalone кластер? В планах раз в месяц заливать в облако порядка 50Гб, обсчитывать и выгружать несколько мегабайт. Microsoft Azure, Amazon AWS, Google Dataproc, Mail.ru Bigdata, Yandex Data Proc? Кто чем пользуется?
Всем привет, подскажите пожалуйста, в каком облачном решении будет удобнее развернуть spark-standalone кластер? В планах раз в месяц заливать в облако порядка 50Гб, обсчитывать и выгружать несколько мегабайт. Microsoft Azure, Amazon AWS, Google Dataproc, Mail.ru Bigdata, Yandex Data Proc? Кто чем пользуется?
амазон, ажур, гугл имеют менджед сервисы (за остальные не знаю); они одинаково по сложности развораичваются (т.е. несложно)
вопрос по менджед сервисам? или хочется купить железо и свое растянуть? (в последнем случае тож разницы нет где тачки)
Всем привет, подскажите пожалуйста, в каком облачном решении будет удобнее развернуть spark-standalone кластер? В планах раз в месяц заливать в облако порядка 50Гб, обсчитывать и выгружать несколько мегабайт. Microsoft Azure, Amazon AWS, Google Dataproc, Mail.ru Bigdata, Yandex Data Proc? Кто чем пользуется?
Всем привет, подскажите пожалуйста, в каком облачном решении будет удобнее развернуть spark-standalone кластер? В планах раз в месяц заливать в облако порядка 50Гб, обсчитывать и выгружать несколько мегабайт. Microsoft Azure, Amazon AWS, Google Dataproc, Mail.ru Bigdata, Yandex Data Proc? Кто чем пользуется?
Всем привет, подскажите пожалуйста, в каком облачном решении будет удобнее развернуть spark-standalone кластер? В планах раз в месяц заливать в облако порядка 50Гб, обсчитывать и выгружать несколько мегабайт. Microsoft Azure, Amazon AWS, Google Dataproc, Mail.ru Bigdata, Yandex Data Proc? Кто чем пользуется?
Возьмите тогда просто то облако, которым уже пользуетесь и все:) Или если его нет, то то что ближе или куда с бОльшей вероятностью будете другие компоненты / данные перемещать когда-нибудь.