Size: a a a

2021 April 30

N

Nikita Blagodarnyy in Data Engineers
его похоже hive как-то сам локально стартует, я пока не понял как
источник

GP

Grigory Pomadchin in Data Engineers
ну вот и ответ)
источник

GP

Grigory Pomadchin in Data Engineers
локальный спарк
источник

GP

Grigory Pomadchin in Data Engineers
источник

GP

Grigory Pomadchin in Data Engineers
чего ему в ярне делать эсли он локальный
источник

AE

Andrey E in Data Engineers
Spark engine получается используется? Запросы какого характера? Сделайте explain для квери, если там только fetchtask то hive даже execution engine стартовать не будет и читает данные напрямую из стораджа. Это поведение настраивается через hive.fetch.task.conversion параметр
источник

N

Nikita Blagodarnyy in Data Engineers
не, там осмысленное что-то
источник

Р

Ринат in Data Engineers
Я правильно понимаю, что если я юзаю pyspark, то сабмитить не нужно?
источник

GP

Grigory Pomadchin in Data Engineers
как ты к такому выводу пришел?
источник

GP

Grigory Pomadchin in Data Engineers
источник

N

Nikita Blagodarnyy in Data Engineers
Почему не нужно? А как ты на спарк свое приложение запустишь?
источник

ME

Max Efremov in Data Engineers
python main.py 😁
источник

N

Nikita Blagodarnyy in Data Engineers
Только если ты в интерактивной какой-то шняге сидишь, типа цеппелин или консольный пуспарк. Тогла они за тебя сабмитят.
источник

Р

Ринат in Data Engineers
Понял, спасибо
источник

Р

Ринат in Data Engineers
Хотя я как раз и использую консольный
источник

Р

Ринат in Data Engineers
источник

N

Nikita Blagodarnyy in Data Engineers
Жупитор ещё можно примандить или в пучарм настроить ремоут интерпретер
источник

N

Nikita Blagodarnyy in Data Engineers
И грузи свои цсвшки в тупандас
источник

Р

Ринат in Data Engineers
Почему тогда такое может быть?
источник

N

Nikita Blagodarnyy in Data Engineers
А че за скедулер? Кто ресурсы выдаёт джобам?
источник