Size: a a a

2021 June 04

ME

Max Efremov in Data Engineers
Хотя мне пока для работы 32 гигов вроде хватает. Самое больше, что делаю на компе: hdp sandbox запускаю, ему надо много памяти
источник

P

Pavel in Data Engineers
Ептыть
источник

P

Pavel in Data Engineers
Привыкнете так) жить в каучуковом с т.зр. ресурсоемкости окружении
источник

AZ

Anton Zadorozhniy in Data Engineers
в этом и поинт, приучать инженеров мыслить не в терминах "сколько у нас серверов, пусть работают", а "как нам дешевле сделать Х и не потратить лишнего"
источник

AE

Alexey Evdokimov in Data Engineers
облака, облака, и ещё раз облака
источник

P

Pavel in Data Engineers
Да ну)) зачем)))
источник

AE

Alexey Evdokimov in Data Engineers
а уж какие именно, это в зависимости от условий
источник

AE

Alexey Evdokimov in Data Engineers
на "поиграться" бесплатного лимита везде хватит
источник

AZ

Anton Zadorozhniy in Data Engineers
инженера который освоил эту культуру сразу видно, у него первые вопросы: а какая у вас политика тэгов, как настроен клауд уборщик, есть ли зарезервированный капасити, можно ли использовать споты
источник

l

loner in Data Engineers
Всем здравствуйте! Сейчас активно изучаю SQL, знаю Python. Что учить дальше на пути к становлении Data Engineer?
источник

МК

Михаил Королев... in Data Engineers
spark без сомнения!
источник

МК

Михаил Королев... in Data Engineers
через призму python - т.е. pyspark
источник

T

T in Data Engineers
Там сегодня выше пару родмапов постили
источник

AE

Alexey Evdokimov in Data Engineers
откуда эт столько народу привалило
источник

AY

Andrew Ya in Data Engineers
https://t.me/rockyourdata здесь ссылку оставили
источник

AE

Alexey Evdokimov in Data Engineers
а.
ну, тут 90% времени скучно, и подробные ответы на плохо сформулированные вопросы. остальные 10% — трёп на левые темы.
источник

TC

Tasty Cake in Data Engineers
Всем привет. Может кто-то подскажет. Есть хадуп-кластер в докер-сворме.  1 неймнода 2 датаноды. Периодически одна из датанод отваливается. Лечу так: просто перезагружаю сервисы через команду docker service update -f name_of_service. Как сделать, чтобы среда работала стабильно? Среда у меня дев. Сейчас проект в MVP. Но мы через пару месяцев, в случае удачи, уходим в прод
источник

TC

Tasty Cake in Data Engineers
Мы загружали curlом, потом просто в хайве смотрели данные
источник
2021 June 05

D

Dmitry in Data Engineers
Добрый день! Нужен совет от сообщества. Планирую переключиться с java-разработчика на DE.  В июле-августе думаю собеситься. Сейчас заканчиваю курс OTUS по экосистеме Hadoop. Вопрос: есть ли смысл упираться в финальный петпроект или лучше сконцентрироваться на изучении основных фреймворков типа Spark, Spark Streaming, Flink? Будут ли при собеседованиях обращать внимание на такие проекты? Если да, то какую связку технологий лучше использовать? Заранее всем спасибо!
источник

TC

Tasty Cake in Data Engineers
Добрый день. Думаю лучше сконцентрироваться на технологиях. Разобраться в тонкостях. Если вы хотите сделать проект, то сделайте с охватом перечисленных технологиях. По спарку конкретно сделайте работу с дельта лейком. Ну и можете стримы с флинком или с кафкой .А показывать или нет финальный проект - это на ваше усмотрение. Многие работодатели сами дают ТЗ
источник