Size: a a a

2017 January 20

NK

ID:1373407 in Data Engineers
Собственно предлагаю обсуждать все вопросы связанные с Apache Hadoop стеком: Деплой Spark джоб, работат с  дистрибутивам от Hortonworks , Cloudera и так далее
источник

NK

ID:1373407 in Data Engineers
Кто, как спарк джобы деплоит?
источник

EM

Emil Magerramov in Data Engineers
Кто-нибудь запускает Спарк в jupyter?
источник

NK

ID:1373407 in Data Engineers
Emil Magerramov
Кто-нибудь запускает Спарк в jupyter?
Насколько мне известно,  датасайнтисты делают там свою науку, после чего  показывают свой ноутбук разработчику. и он его уже на Scala реализует
источник

NK

ID:1373407 in Data Engineers
Мы ноутбуки не используем
источник

EM

Emil Magerramov in Data Engineers
Хотел тоже попробовать
источник

AD

Alex D in Data Engineers
Сам не пробовал но вроде не сложно:
https://docs.continuum.io/anaconda-scale/howto/spark-overview#
источник

SS

Sergey Salamanov in Data Engineers
Хочу ручками попробовать hadoop, как сделать свой кластер и тд и тп и как бы в домашних условиях, а не в конторе с готовой инфраструктурой. Это вообще реально? Как вы начинали осваивать hadoop?
источник

NK

ID:1373407 in Data Engineers
Sergey Salamanov
Хочу ручками попробовать hadoop, как сделать свой кластер и тд и тп и как бы в домашних условиях, а не в конторе с готовой инфраструктурой. Это вообще реально? Как вы начинали осваивать hadoop?
Есть дистрибутивы от CLoudera и Hortonworks
источник

SS

Sergey Salamanov in Data Engineers
в чём их особенность? они для локальных машин?
источник

NK

ID:1373407 in Data Engineers
У них есть сандбоксы, где все предустановлено. Единственное, нужна машина у которой памяти хотябы 8 , алучше 16 гигабайт.
источник

NK

ID:1373407 in Data Engineers
Ты просто качаешь образ диска и запускаешьп под виртуальной машиной, если всё лагает и тормозит, то стоит отключить что0нибудь из сервисов
источник

SS

Sergey Salamanov in Data Engineers
спасиб) сегодня начну
источник

SS

Sergey Salamanov in Data Engineers
а как с книжками/курсами рускоязычными?
источник

SS

Sergey Salamanov in Data Engineers
или норм только на english?
источник

NK

ID:1373407 in Data Engineers
Нормально только на английском
источник

NK

ID:1373407 in Data Engineers
Хотя по самому хадупу вышла книга на русском от орейли, Apache Hadoop полное руководство.
источник

NK

ID:1373407 in Data Engineers
Она в качестве основ подойдет
источник

SS

Sergey Salamanov in Data Engineers
👍
источник

NK

ID:1373407 in Data Engineers
Но сейчас непосредственно на хадупе мало кто считает ( считай леджаси уже)
источник