Телеграмм чат группы hadoopusers страница 2206

Всем привет, чтобы использовать Спарк мне достаточно будет развернуть локально только сам Спарк и использовать его с помощью питона или нужно что-то ещё?

источник

12:41пожаловаться #6

Alexander in Data Engineers

Только спарк

источник

12:49пожаловаться #7

Mikhail Epikhin in Data Engineers

Андрей Жуков

осторожнее, а то будет как с трубкой и ватсоном

простите, а что не так с трубкой и ватсоном?

источник

12:52пожаловаться #8

Dmitry Zuev in Data Engineers

Ватсон уже не может без трубки

источник

12:53пожаловаться #9

palladdiumm in Data Engineers

это из анекдота, в котором Ватсон пытался отучить Холмса курить трубку

источник

12:54пожаловаться #10

АС

Артур Семенов in Data Engineers

Alexander

Только спарк

Можно ещё вопрос, т.е. я ставлю Спарк, запускаю его, поверх него запускаю Юпитер и там уже работаю с данными, все верно?

источник

12:59пожаловаться #11

АЖ

Андрей Жуков in Data Engineers

Артур Семенов

можно запускать спарк в локале прямо из жупиитера

источник

13:00пожаловаться #12

Renarde in Data Engineers

Андрей Жуков

можно запускать спарк в локале прямо из жупиитера

а если хочется просто потестировать и поиграться, можно взять готовый jupyter с настроенным спарком:

https://hub.docker.com/r/jupyter/all-spark-notebook/

источник

13:40пожаловаться #13

Dmitry Zuev in Data Engineers

Mikhail Epikhin

CH же любит пожирнее, чтобы по 1-10К было на вставке

ну кароч батчем на 100к все и решилось

источник

13:54пожаловаться #14

Mikhail Epikhin in Data Engineers

Dmitry Zuev

ну кароч батчем на 100к все и решилось

ну и отличненько:)

источник

13:55пожаловаться #15

Alex in Data Engineers

кто-нибудь настраивал livy + hive с kerberos?

джоба запускается как положена, но вот как туда прокинуть delegation token на хайв?
закидывать keytab на какой hdfs чтобы spark сам логинился не хочется

в oozie креденшиал провайдеры есть и всё ок
а вот с интерактивными сессиями в ливи как-то …..

источник

13:55пожаловаться #16

Evgenij in Data Engineers

а через амбари не получилось?

источник

13:57пожаловаться #17

Alex in Data Engineers

вот через него и настроен, но внутри спарк контекста токены только
YARN_AM_RM_TOKEN
HDFS_DELEGATION_TOKEN

источник

13:59пожаловаться #18

Alex in Data Engineers

более странно что я не найду это даже в самом livy коде
поэтому и возник вопрос “а он вообще в это умеет” ?

источник

14:00пожаловаться #19

Вадим in Data Engineers

Ребят, я слышал что тут была группа людей которая писала коннектор спарк-кликхаус. Есть у кого нибудь ссылка на репу, если это взлетело?

источник

16:16пожаловаться #20