Size: a a a

2021 January 06

AZ

Anton Zadorozhniy in Data Engineers
K S
Не-а, они (не дата инженеры) почему-то думают только на один шаг вперед, не думаю о многих других аспектах.
Имеет смысл переезжать если у вас большой цеф для всего (объектный и блочный сторадж) + опсы умеют его готовить + достаточно железа и поддерживаете этот цэф не вы)
источник

АЖ

Андрей Жуков... in Data Engineers
Anton Zadorozhniy
Это прям надо постараться, чтобы на идентичном железе (особенно бареметал) обогнать HDFS на чтении больших файлов в батч джоб
Ну вдруг по хадупу спецов нет,  а по цефу есть
источник

A

Alex in Data Engineers
поддерживаете этот цэф не вы - прямо как я говорю про mongodb и k8s
источник

АЖ

Андрей Жуков... in Data Engineers
Alex
поддерживаете этот цэф не вы - прямо как я говорю про mongodb и k8s
Я так и про хадуп говорю!
источник

KS

K S in Data Engineers
Андрей Жуков
Для CTO это странное поведение :) ему надобно думать на n+1 шагов
90% этой команды странные 😁
Я сегодня посмотрел почему вываливается arrow либа при генерации паркета - оказывается кто-то догадался в постгресе создать кастомные типы данных типа smart_ass_type, которые привязан к проверке на not null.
источник

A

Alex in Data Engineers
Андрей Жуков
Я так и про хадуп говорю!
ну хадуп я знаю =)

поэтому часто лучше когда поддерживаю я, всё равно к хадуп тиму регулярно ходить рассказывать что изменить
источник

СХ

Старый Хрыч... in Data Engineers
K S
Наш CTO почему то думает, что ceph проще,быстрее и надежнее, чем hdfs.
😐в кащенко его срочно
источник

СХ

Старый Хрыч... in Data Engineers
и чем скорее тем лучше
источник

AZ

Anton Zadorozhniy in Data Engineers
Андрей Жуков
Я так и про хадуп говорю!
Это нормальная реакция инженера когда к нему приходят и говорят: теперь с того что вы выбрали надо переезжать вот на это
источник

AZ

Anton Zadorozhniy in Data Engineers
K S
90% этой команды странные 😁
Я сегодня посмотрел почему вываливается arrow либа при генерации паркета - оказывается кто-то догадался в постгресе создать кастомные типы данных типа smart_ass_type, которые привязан к проверке на not null.
Ну на это могут быть причины
источник

KS

K S in Data Engineers
Anton Zadorozhniy
Имеет смысл переезжать если у вас большой цеф для всего (объектный и блочный сторадж) + опсы умеют его готовить + достаточно железа и поддерживаете этот цэф не вы)
Не, поддержка и разработка всё сами, вот этими вот мозолистыми руками.
источник

АЖ

Андрей Жуков... in Data Engineers
K S
Не, поддержка и разработка всё сами, вот этими вот мозолистыми руками.
Тады нахнах
источник

СХ

Старый Хрыч... in Data Engineers
K S
Наш CTO почему то думает, что ceph проще,быстрее и надежнее, чем hdfs.
😐ceph быстрее... у вашего сто точно нет справки о шизофрении? он вообще вкурсе при каких условиях  ceph будет быстрее чем hdfs?
источник

СХ

Старый Хрыч... in Data Engineers
мало того что вам нужно будет минимум 10г линки по 2 шт на сервер, минимум 4 хороший ssd на сервер под мониторы, а ещё плюс ресурсов он сожрёт в разы больше чем hdfs
источник

KS

K S in Data Engineers
Старый Хрыч
😐ceph быстрее... у вашего сто точно нет справки о шизофрении? он вообще вкурсе при каких условиях  ceph будет быстрее чем hdfs?
Хз... Я тут всего месяц пока, но уже готов поставить диагноз. Для них зона ответственности заканчивается сохранением записи в постгрес, а дальше хоть трава не расти.
источник

СХ

Старый Хрыч... in Data Engineers
Всё по заветам Симонова, стал СТО принивай Волевые решения и ищи потом виноватых в их неисполнении
источник

АЖ

Андрей Жуков... in Data Engineers
K S
90% этой команды странные 😁
Я сегодня посмотрел почему вываливается arrow либа при генерации паркета - оказывается кто-то догадался в постгресе создать кастомные типы данных типа smart_ass_type, которые привязан к проверке на not null.
Возможно, CTO у вас не из мира бигдатки или хотя бы джавы
источник

АЖ

Андрей Жуков... in Data Engineers
Старый Хрыч
Всё по заветам Симонова, стал СТО принивай Волевые решения и ищи потом виноватых в их неисполнении
Не надо тут обобщать :)
источник

СХ

Старый Хрыч... in Data Engineers
Андрей Жуков
Не надо тут обобщать :)
так я про его заветы говорю
источник

KS

K S in Data Engineers
Старый Хрыч
мало того что вам нужно будет минимум 10г линки по 2 шт на сервер, минимум 4 хороший ssd на сервер под мониторы, а ещё плюс ресурсов он сожрёт в разы больше чем hdfs
У нас уже стоит 10Гбитная карта, но от этого не легче, не понос так золотуха - блок сторидж отваливается периодически.
источник