Size: a a a

2021 August 02

CO

Chern Oleksander in Moscow Spark
root
|-- id: integer (nullable = true)
|-- date_rep: date (nullable = true)
|-- updated_date: timestamp (nullable = true)
|-- user_type: string (nullable = true)
|-- p_years: integer (nullable = true)
|-- p_months: integer (nullable = true)
|-- p_days: integer (nullable = true)
|-- p_dates: date (nullable = true)
|-- sys_updated_by: string (nullable = true)
|-- sys_updated_time: timestamp (nullable = true)
|-- years: string (nullable = true)
|-- months: string (nullable = true)
|-- days: string (nullable = true)
|-- dates: string (nullable = true)
источник

CO

Chern Oleksander in Moscow Spark
было не то поле выбрано ((( всё работает
источник
2021 August 04

R

Roman in Moscow Spark
Всем привет.
Подскажите пожалуйста, возможно ли в спарке указать список конкретных хостов ярна, которые он может использовать?
источник

A

Alex in Moscow Spark
можно попробовать использовать node labels
источник

A

Alex in Moscow Spark
но это ещё доп настройки со стороны ярна нужны
источник

R

Roman in Moscow Spark
те просто в конфиге не прописать?
источник

☭S

☭ ⤳ λ Shinkevich... in Moscow Spark
Ты можешь только драйверу указать году, не более
источник

☭S

☭ ⤳ λ Shinkevich... in Moscow Spark
Ну, или, как сказали выше, настроить в ярне очередь на конкретные ноды и сабмитить в эту очередь
источник
2021 August 05

Ё

Ё in Moscow Spark
Хай гайз. А можете подсказать, спарк можно запускать не на edge-node? Если да, то не поделитесь ли гайдом, или где почитать про это. 🙏
источник

ММ

Максим Мартынов... in Moscow Spark
Если master: yarn, то нельзя
источник

NN

No Name in Moscow Spark
А в cluster mode разве нельзя?
источник

GP

Grigory Pomadchin in Moscow Spark
кластер мод юзай он выберет драйвер сам на одной из нод кластера
источник

GP

Grigory Pomadchin in Moscow Spark
Да можн хз
источник

GP

Grigory Pomadchin in Moscow Spark
источник

Ё

Ё in Moscow Spark
Спасибо
источник

MD

Mikhail Dumenko in Moscow Spark
Переслано от Andrey Sirotkin
Мы трафик снижать не можем.
источник

AS

Anton Solomonov in Moscow Spark
Подскажите, пожалуйста где нужно указывать параметр Rdd.partitions().size() чтобы распараллелить процесс на несколько  нод?
источник

GP

Grigory Pomadchin in Moscow Spark
источник

GP

Grigory Pomadchin in Moscow Spark
ну если ты плохо прочитал / надо партицирование поменять то .repartition
источник
2021 August 06

GP

Grigory Pomadchin in Moscow Spark
Боты чёт дикие
источник