Size: a a a

2019 August 23

E

Evgeny in Data Engineers
ну или костыляешь и потом городишь ;)
источник

S

Stanislav in Data Engineers
Evgeny
проще доку открыть. умеет standalone, много разных шаблонов чтения\записи из которых городишь то, что нужно
да вот доку открыл
она большая )
какой-нибудь семпл бы )
хотя уже нашел с хайлоада 17 доклад от рамблера, вполне себе
правда пока до критики не дошел, а все хорошее каждый умеет рассказать )
источник

E

Evgeny in Data Engineers
Stanislav
да вот доку открыл
она большая )
какой-нибудь семпл бы )
хотя уже нашел с хайлоада 17 доклад от рамблера, вполне себе
правда пока до критики не дошел, а все хорошее каждый умеет рассказать )
ну вот у нас оно все так же и работает. Не помню, чтобы с ним особые проблемы были, но тут важно что вы будете использовать, у нас это, в основном, кафка и hdfs
источник

S

Stanislav in Data Engineers
кейс примерно такой же
в наличии много всяких штук, но достаточно и кафки с хдфс
только еще непонятно, где профит относительно какой-нибудь кафка-стримс на обработку + самопис кафка-хдфс
источник

ПФ

Паша Финкельштейн in Data Engineers
Старый Хрыч
я о нём только негатив читал
Прям вот только что на Moscow spark говорили что пока не надо гонять натив на каждую сторону pyspark вполне норм
источник

A

Alex in Data Engineers
ну тут же вопрос что ты хочешь
хочешь шустрее - скала
хочешь чтобы датасатанистам привычней - пайспарк

часто качество менее важно чем value которое может принести код
источник

A

Alex in Data Engineers
это как с jupyter notebook:
все плюются что в продакшен пихать их это боль
но никого это не останавливает, так как цикл
“датасатанист наговнякол-ушло в прод” более быстрый чем
“датасатанист наговнякал - объянил программисту и он переписал на scala/java - ушло в прод”
источник

A

Alex in Data Engineers
@erzentd поэтому красота кода и красота для бизнеса не всегда совпадают =)
источник

AK

Anton Kosarev in Data Engineers
а потом прод взрывается, потому что у дс и у разработчиков немного разные представления об устройстве мира
источник

AN

Anna Novikova in Data Engineers
Anton Kosarev
а потом прод взрывается, потому что у дс и у разработчиков немного разные представления об устройстве мира
источник

СХ

Старый Хрыч in Data Engineers
Anton Kosarev
а потом прод взрывается, потому что у дс и у разработчиков немного разные представления об устройстве мира
а виноваты потом во всём девупсы, потому что не написали спасительных хелсчеков
источник

СХ

Старый Хрыч in Data Engineers
данные мертвы, копий нет за 12 часов, а реплика умерла тоже следом
источник

АЖ

Андрей Жуков in Data Engineers
Anton Kosarev
а потом прод взрывается, потому что у дс и у разработчиков немного разные представления об устройстве мира
Тут уже писпарк не виноват :)
источник

K

KrivdaTheTriewe in Data Engineers
Андрей Жуков
Тут уже писпарк не виноват :)
А Девопсы
источник

S

Stanislav in Data Engineers
у писпарка фамилии нет, у девопса есть
виноват девопс, инфа сотка
источник

ПФ

Паша Финкельштейн in Data Engineers
девопс — это не человек
источник

АЖ

Андрей Жуков in Data Engineers
KrivdaTheTriewe
А Девопсы
Все там молодцы!
источник

S

Stanislav in Data Engineers
Паша Финкельштейн
девопс — это не человек
прально
источник

АЖ

Андрей Жуков in Data Engineers
Паша Финкельштейн
девопс — это не человек
Это Хрыч?
источник

ПФ

Паша Финкельштейн in Data Engineers
Андрей Жуков
Это Хрыч?
Это может быть. Но обычно это всё-таки процесс )
источник