Size: a a a

2021 June 18

А

Александр in Data Engineers
Ух ты незнал
источник

N

Nikita Blagodarnyy in Data Engineers
Если немного упороться и раскурить статью одного китайца, то можно прямо в пучарме настроить ремоут интерпретер где есть спарк и говнякать прямо из пучарма.
источник

NN

No Name in Data Engineers
Можно так, а можно юпитер сервер настроить, если пайчарм профешнал.)
источник

N

Nikita Blagodarnyy in Data Engineers
Пошла жара. Странно, что бдт никто не вспомнил.
источник

ПФ

Паша Финкельштейн... in Data Engineers
Так вроде бы этого есть дс эдишн? Ну и вскод если надо именно бесплатное решение иметь
источник

ПФ

Паша Финкельштейн... in Data Engineers
Я вспомнил, но просили же бесплатное
источник

AZ

Anton Zadorozhniy in Data Engineers
да cost чего угодно, open source проект обычно не представляют "бесплатный ..." Databricks Community Edition бесплатный, GitHub Codespaces пока бесплатный..
источник

ПФ

Паша Финкельштейн... in Data Engineers
Ну мы знаем людей, которые просто гоняют локальный Юпитер с пайспарком и им ок. Если очень надо - будет бесплатно
источник

AZ

Anton Zadorozhniy in Data Engineers
ну наверное так и надо сказать, запускайте open source jupyter на своем текущем железе - это бесплатно
у меня легкая идиосинкразия когда open source выставляют как "бесплатное" в первую очередь... я так и представляю как на конференции объявляют: "Линус Торвальдс, разработчик бесплатного ядра операционной системы"
источник

ПФ

Паша Финкельштейн... in Data Engineers
Я понимаю что ничто из этого не до конца бесплатное, но часто можно пренебречь костами потому что они аккуратно размываются в остальных
источник

ПФ

Паша Финкельштейн... in Data Engineers
Ну ядро совсем бесплатное же! Опенсорс не всегда бесплатный, как мы знаем, но обычно всё что можно собрать и запустить самому удобно считать бесплатным
источник

ПФ

Паша Финкельштейн... in Data Engineers
Потому что иначе может становится очень сложной
источник

А

Александр in Data Engineers
С танцем с бубном поднял Jupyter и Spark на винде. Вопрос - блок с findspark теперь всегда придется добавлять, при разработке любого скрипта? Т.е. как бы помогать Jupiter найти инстанс спарка при каждом запуске?
источник

ПФ

Паша Финкельштейн... in Data Engineers
Наверняка в настройках интерпретатора можно указать
источник

NN

No Name in Data Engineers
Сори за небольшой офтоп, но, мне кажется, проще и полезнее завести линух и делать это сразу в нем, гемора в разы меньше.
А насчёт файндспарка - можно и без него, просто задай переменные окружения (spark_home, etc)
источник

А

Александр in Data Engineers
точно, спасибо!
источник

B

BadRat in Data Engineers
Под виндой можно поставить docker desktop а в нем развернуть https://hub.docker.com/r/jupyter/all-spark-notebook ! Юпитер - спарк3 - питон - скала- все в одном
источник
2021 June 19

А

Александр in Data Engineers
красота какая! Спасибо
источник

KS

K S in Data Engineers
Кто нибудь пробовал varada?
источник

KS

K S in Data Engineers
посмотрел их рекламу, пишут намного быстрее, чем aws athena
источник