Size: a a a

2021 May 03

Р

Ринат in Data Engineers
На моенй машине pyspark
источник

Р

Ринат in Data Engineers
Я из шелла на свой машине отправляю команды
источник

GP

Grigory Pomadchin in Data Engineers
это я понял
источник

GP

Grigory Pomadchin in Data Engineers
я не понял работало то как
источник

GP

Grigory Pomadchin in Data Engineers
как ты пришел к выводу что что-то с докером
источник

Р

Ринат in Data Engineers
А, работало так: я на хосте с докером, зашел внутрь контейнера со спарком, и попытался выполнить тоже самое, и он сделал
источник

GP

Grigory Pomadchin in Data Engineers
- ты на мастере с докером зашел в контейнер и выполнил тоже самое и заработало
а ты пробовал на мастере запустить шелл не в контейнере?
источник

GP

Grigory Pomadchin in Data Engineers
я не знаю как у тебя там спарк поднят
источник

GP

Grigory Pomadchin in Data Engineers
если все на хост мапится то скорее всего с докером все ок
источник

Р

Ринат in Data Engineers
version: "3"

services:
 spark:
   image: docker.io/bitnami/spark:3
   environment:
     - SPARK_MODE=master
     - SPARK_RPC_AUTHENTICATION_ENABLED=no
     - SPARK_RPC_ENCRYPTION_ENABLED=no
     - SPARK_LOCAL_STORAGE_ENCRYPTION_ENABLED=no
     - SPARK_SSL_ENABLED=no
     - SPARK_MASTER_HOST=0.0.0.0
   deploy:
       replicas: 1
       placement:
               constraints:
                       - node.hostname==***
   ports:
     - '8005:8080'
     - '7077:7077'
     - '4040:4040'
 spark-worker-1:
   image: docker.io/bitnami/spark:3
   deploy:
       replicas: 1
       placement:
               constraints:
                       - node.hostname==***
   environment:
     - SPARK_MODE=worker
     - SPARK_MASTER_URL=spark://spark:7077
     - SPARK_WORKER_MEMORY=1G
     - SPARK_WORKER_CORES=1
     - SPARK_RPC_AUTHENTICATION_ENABLED=no
     - SPARK_RPC_ENCRYPTION_ENABLED=no
     - SPARK_LOCAL_STORAGE_ENCRYPTION_ENABLED=no
     - SPARK_SSL_ENABLED=no
источник

Р

Ринат in Data Engineers
Вот как поднят спарк
источник

NN

No Name in Data Engineers
Переиспользовал где? В другой джобе? Или в другом стейдже?
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Ничего не теснит кх и теперь уже не будет
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Чтобы продавать, им надо поправить несколько энтерпрайз фич, начиная от аутентификации и заканчивая оптимизацией запросов через odbc
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Мы вот сейчас как раз прикручиваем трино в powerbi и тут сразу много болей...
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Но в целом, игрушка классная, мы пока тестируем замену хайв
источник

T

T in Data Engineers
В другом стэйдже
источник

ПБ

Повелитель Бури... in Data Engineers
Зачем? Есть sparksql, hive on tez, hive on spark. Чем не устраивает?
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Скорость и sql
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Спарк скоростной, но в bi на нем не попишешь
источник