Size: a a a

2021 January 16

SS

Sergey Shushkov in Data Engineers
Tsh Tsh
Хех, распечатай в пыхтон скрипте os.environ и посмотри что там у тебя
А зачем? Если оно у него и в теминале ходуб бинарник не видит?
Пусть сразу експорт в path делает и голову не марочит.
источник

KS

K S in Data Engineers
источник

GP

Grigory Pomadchin in Data Engineers
ну вот видишь как хорошо
источник

GP

Grigory Pomadchin in Data Engineers
теперь знаешь что обфускация ошибок не оч удобно
источник

KS

K S in Data Engineers
Спасибо большое всем!
источник

KS

K S in Data Engineers
Пойду перекушу что-нибудь 😁
источник

ПБ

Повелитель Бури... in Data Engineers
Anton Zadorozhniy
Не очень понятный вопрос, вы пытаетесь найти причины перейти на HDFS? Или уговорить кого-то перейти на minio? Причин может быть много: производительность, совместимость, операционные процессы; HDFS используется где данных много, там просто так не перепрыгивают с компонента на компонент
Нет, просто сейчас это как прыжок веры, типа s3  лучше hdfs и вроде все ок! Но может чего не не заметили, вряд ли люди остаются на hdfs ради bdsm
источник

A

Alex in Data Engineers
выше были примеры @workales про то что в их ворклоаде hdfs значительно быстрее

всё зависит от задач и кто менеджит эту fs
источник

A

Alex in Data Engineers
мелкие файлы - лучше закинуть в s3, hdfs от этого плохо
большие файлы и поточная обработка - возможно hdfs вам будет лучше, так как select api ещё тот зверь и когда говорят что сеть резиновая, то многие лукавят
источник

AS

Andrey Smirnov in Data Engineers
Повелитель Бури
Нет, просто сейчас это как прыжок веры, типа s3  лучше hdfs и вроде все ок! Но может чего не не заметили, вряд ли люди остаются на hdfs ради bdsm
К нам раз стучались с Яндекс.облака, посчитали сколько будет стоить наша инфраструктура у них в облаке, получилось раза в 2 дороже (это без затрат на переезд, дописывание кода и т.д.)
источник

AZ

Anton Zadorozhniy in Data Engineers
Повелитель Бури
Нет, просто сейчас это как прыжок веры, типа s3  лучше hdfs и вроде все ок! Но может чего не не заметили, вряд ли люди остаются на hdfs ради bdsm
BDSM? Вы точно инженер?
источник

МП

Михаил Петрович... in Data Engineers
Anton Zadorozhniy
BDSM? Вы точно инженер?
*шутка про Big Data Security Management*
источник

AZ

Anton Zadorozhniy in Data Engineers
Это разные системы, с разными преимуществами, HDFS это прекрасная простая система, с низким порогом входа но богатыми возможностями тюнинга, Minio это попытка унифицировать с облачным сервисом (который изначально сделан универсальным, у него нет таких возможностей тюнинга, к примеру)
источник

A

Alex in Data Engineers
в текущих редакциях с шифрованием на диске и EC я бы не сказал что она уж настолько проста
источник

AZ

Anton Zadorozhniy in Data Engineers
Ну это опционально же, включают те кому нужно
источник

A

Alex in Data Engineers
но базовая идея конечно проста
особенно запихнём fsimage в память для скорости работы

правда отсюда и проблемы многие
источник

A

Alex in Data Engineers
@dartov а в ozone не смотрел?
вроде как комиты какие-то туда влетают, но насколько оно живо и перспективно?
источник

AZ

Anton Zadorozhniy in Data Engineers
Alex
@dartov а в ozone не смотрел?
вроде как комиты какие-то туда влетают, но насколько оно живо и перспективно?
Нет, пока не подворачивалась возможность, и в планах нет
источник

AZ

Anton Zadorozhniy in Data Engineers
Alex
но базовая идея конечно проста
особенно запихнём fsimage в память для скорости работы

правда отсюда и проблемы многие
Ну вот можно fsimage положить в масштабируемую базу, как HopsFS
источник

A

Alex in Data Engineers
там много чего можно сделать

тот же сервер бейз роутинг так с беты и не вышел чтобы допилить шардирование неймноды и делать viewfs не на клиенте, а на сервере
так понимаю основная часть сторейдж активности в сейчас двинулась больше в озон

вот и стало интересно
источник