Телеграмм чат группы hadoopusers страница 3776

Size: a a a

Data Engineers

2588 membersпожаловаться на группу

2021 June 18

Александр in Data Engineers

Ух ты незнал

источник

19:00пожаловаться #1

Nikita Blagodarnyy in Data Engineers

Если немного упороться и раскурить статью одного китайца, то можно прямо в пучарме настроить ремоут интерпретер где есть спарк и говнякать прямо из пучарма.

источник

19:02пожаловаться #2

No Name in Data Engineers

Можно так, а можно юпитер сервер настроить, если пайчарм профешнал.)

источник

19:04пожаловаться #3

Nikita Blagodarnyy in Data Engineers

Пошла жара. Странно, что бдт никто не вспомнил.

источник

19:04пожаловаться #4

ПФ

Паша Финкельштейн... in Data Engineers

Так вроде бы этого есть дс эдишн? Ну и вскод если надо именно бесплатное решение иметь

источник

19:05пожаловаться #5

ПФ

Паша Финкельштейн... in Data Engineers

Я вспомнил, но просили же бесплатное

источник

19:05пожаловаться #6

Anton Zadorozhniy in Data Engineers

да cost чего угодно, open source проект обычно не представляют "бесплатный ..." Databricks Community Edition бесплатный, GitHub Codespaces пока бесплатный..

источник

19:05пожаловаться #7

ПФ

Паша Финкельштейн... in Data Engineers

Ну мы знаем людей, которые просто гоняют локальный Юпитер с пайспарком и им ок. Если очень надо - будет бесплатно

источник

19:06пожаловаться #8

Anton Zadorozhniy in Data Engineers

ну наверное так и надо сказать, запускайте open source jupyter на своем текущем железе - это бесплатно
у меня легкая идиосинкразия когда open source выставляют как "бесплатное" в первую очередь... я так и представляю как на конференции объявляют: "Линус Торвальдс, разработчик бесплатного ядра операционной системы"

источник

19:09пожаловаться #9

ПФ

Паша Финкельштейн... in Data Engineers

Я понимаю что ничто из этого не до конца бесплатное, но часто можно пренебречь костами потому что они аккуратно размываются в остальных

источник

19:09пожаловаться #10

ПФ

Паша Финкельштейн... in Data Engineers

Ну ядро совсем бесплатное же! Опенсорс не всегда бесплатный, как мы знаем, но обычно всё что можно собрать и запустить самому удобно считать бесплатным

источник

19:10пожаловаться #11

ПФ

Паша Финкельштейн... in Data Engineers

Потому что иначе может становится очень сложной

источник

19:11пожаловаться #12

Александр in Data Engineers

С танцем с бубном поднял Jupyter и Spark на винде. Вопрос - блок с findspark теперь всегда придется добавлять, при разработке любого скрипта? Т.е. как бы помогать Jupiter найти инстанс спарка при каждом запуске?

источник

20:09пожаловаться #13

ПФ

Паша Финкельштейн... in Data Engineers

Наверняка в настройках интерпретатора можно указать

источник

20:14пожаловаться #14

No Name in Data Engineers

Сори за небольшой офтоп, но, мне кажется, проще и полезнее завести линух и делать это сразу в нем, гемора в разы меньше.
А насчёт файндспарка - можно и без него, просто задай переменные окружения (spark_home, etc)

источник

20:15пожаловаться #15

Александр in Data Engineers

точно, спасибо!

источник

20:20пожаловаться #16

BadRat in Data Engineers

Под виндой можно поставить docker desktop а в нем развернуть https://hub.docker.com/r/jupyter/all-spark-notebook ! Юпитер - спарк3 - питон - скала- все в одном

источник

21:38пожаловаться #17

2021 June 19

Александр in Data Engineers

красота какая! Спасибо

источник

00:08пожаловаться #18

K S in Data Engineers

Кто нибудь пробовал varada?

источник

01:50пожаловаться #19

K S in Data Engineers

посмотрел их рекламу, пишут намного быстрее, чем aws athena

источник

01:51пожаловаться #20