Телеграмм чат группы hadoopusers страница 4429

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Engineers

3187 membersпожаловаться на группу

2021 October 27

A

Alex in Data Engineers

часть вещей которые только в мастере в клоудеру и хортон (когда он ещё был жив) активно бекпортились
сам хадуп совсем не спешит их бекпортить в старые ветки

источник

08:40пожаловаться #1

A

Alex in Data Engineers

только критикал вещи

источник

08:40пожаловаться #2

A

Alex in Data Engineers

что спарк уходит в кастомизацию тоже верно

амазоновский, датабрикс, у мс вроде тоже свой

основная проблема что сорцы они не отдают патчей, поэтому иногда ошибки сложно дебажить

источник

08:45пожаловаться #3

RI

Rustam Iksanov in Data Engineers

Это фишка облаков, недавно Бартунов на это жаловался

источник

08:57пожаловаться #4

A

Alex in Data Engineers

я понимаю что фишка
и даже понимаю почему облака это делают (взяли роль клоудеры для самих себя, так как у кастомеров должно всё работать)
причем нужно добавить "оптимизации" чтобы у тебя работало лучше чем у конкурентов

но вот граничные случаи когда не работает уже начинаются проблемы

источник

08:59пожаловаться #5

RI

Rustam Iksanov in Data Engineers

и мы опять идем к проприетарным продуктам

источник

09:05пожаловаться #6

A

Alex in Data Engineers

примерно про это @dartov и говорил: уходим от продукта к фреймворку, поверх которого каждый делает что-то своё

источник

09:11пожаловаться #7

AZ

Anton Zadorozhniy in Data Engineers

Ну такое, нужно много инженерных усилий чтобы сделать из тарболов работающее решение, практически вся опсовая и инфосек кухня, а некоторые фичи (оппортунистические контейнеры в YARN, например) нужно доделывать чтобы полететь

источник

09:40пожаловаться #8

RI

Rustam Iksanov in Data Engineers

без сомнения, что есть свои сложности. Но тут все зависит от целей использования. У нас ванильный hbase и спарк c хадупом. И у нас не прямо чистая дата инженерия, просто инструмент подходящий.

источник

09:44пожаловаться #9

AZ

Anton Zadorozhniy in Data Engineers

А какой у вас мониторинг, лог менеджмент, IAM? Умеете делать репликацию между сайтами?

источник

09:46пожаловаться #10

RI

Rustam Iksanov in Data Engineers

Я же говорю, что у нас не дата инженеринг в чистом виде. У нас просто spark как вычислитель и hbase как хранилище. У нас не привычных пайплайнов. У нас очень узконишевая история.

источник

09:49пожаловаться #11

AZ

Anton Zadorozhniy in Data Engineers

Это значит вы можете без IAM, но дистрибутив, мониторинг - все это кто-то должен написать и сопровождать

источник

09:55пожаловаться #12

NB

Nikita Bakanchev in Data Engineers

xs

источник

10:16пожаловаться #13

VP

Vitaly Pismarev in Data Engineers

Народ, а может есть те кто выбирал для хранилища между Bigquey и Snowflake ? Если есть, поделитесь тезисно , плиз, что выбрали и почему ) Особенно в плане костов. Кажется, что это два прям сильно конкурирующих решения

источник

10:30пожаловаться #14

NB

Nikita Bakanchev in Data Engineers

А вы плотно на гугл стеке сидите?

источник

10:55пожаловаться #15

VP

Vitaly Pismarev in Data Engineers

Не, совсем не плотно. Но есть решение на BQ для диджитал маркетинга. Сложилось исторически ) Но в целом там не проблема переехать, весь ETL в dbt и интеграции с внешними провайдерами простые и их немного

источник

11:39пожаловаться #16

AZ

Anton Zadorozhniy in Data Engineers

А какой порядок бюджета у вас? Сотни тысяч, миллионы долларов в год?

источник

11:49пожаловаться #17

VP

Vitaly Pismarev in Data Engineers

Ох, сложно сказать ) Пока скорее первое, может даже меньше чем первое) Но есть перспективы того что решение взлетит и тогда я думаю ценник может быть и 6-значным )

источник

11:56пожаловаться #18

AZ

Anton Zadorozhniy in Data Engineers

по моему опыту (в последнее время - в основном подглядывания за бенчмарками, чем проведения их) на берегу очень сложно сравнить цены облачных решений, нужно пилотировать и вести переговоры с продавцами

источник

11:58пожаловаться #19

VP

Vitaly Pismarev in Data Engineers

В целом пока этим путём и идём. Пилоты, типовые кейсы + сравнение костов.

источник

12:00пожаловаться #20