Телеграмм чат группы hadoopusers страница 2012

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Engineers

1721 membersпожаловаться на группу

2020 January 29

DM

Daniel Matveev in Data Engineers

должны быть, по крайней мере не могу причин почему нет

а логи гц вообще нужно включать всегда опциями на жвм

источник

10:55пожаловаться #1

А

Алексей in Data Engineers

работу делают ограниченное число постоянно работающих воркеров, если параметрами запуска им прописать verbosegc, то влияние будет на все запуске , а нужно только на некоторые. Боюсь, что это скажется на общую производительность

источник

11:10пожаловаться #2

Ik

Ilia ksen in Data Engineers

Ребята, как мне проверить работу чекпоинта при сбое драйвера в yarn?

источник

11:11пожаловаться #3

VS

Vasily Shabanov in Data Engineers

Всем привет!
Есть проект с хадупом/постгрессом и постргрессом в качестве некоего dwh, в который смотрит BI.
На постгрессе выполнялись всякие агрегации/расчёты, но постгресса стало не хватать. Компания, которая разрабатывала «общее» решение, предлагает постгресс заменить на гринплам и переписать агрегации/расчёты под гринплам же.
Мы же хотим расчёты перенести на scala/spark (опыт есть).

Может кто помочь с аргументами против GP?

источник

12:16пожаловаться #4

VS

Vasily Shabanov in Data Engineers

Или GP — очень даже кошерное решение?

источник

12:16пожаловаться #5

DZ

Dmitry Zuev in Data Engineers

какие объемы?

источник

12:16пожаловаться #6

DZ

Dmitry Zuev in Data Engineers

как организовано двх? Нормализованное хранилище?

источник

12:17пожаловаться #7

VS

Vasily Shabanov in Data Engineers

как организовано двх? Нормализованное хранилище?

Звезда. Скажем так, по большей части нормализованное.

источник

12:18пожаловаться #8

DZ

Dmitry Zuev in Data Engineers

чем льёте туда?

источник

12:18пожаловаться #9

DZ

Dmitry Zuev in Data Engineers

что за BI? у ваше bi какой движок: свой или пушдаун в пг?

источник

12:20пожаловаться #10

VS

Vasily Shabanov in Data Engineers

BI — сторонняя компания занимается, со своим продуктом импортозамещённым. Они из пг забирают сами.

источник

12:21пожаловаться #11

DZ

Dmitry Zuev in Data Engineers

У вас уже есть подрядчик который все это делает?
Вы хотите у них забрать и переписать на спарк?

источник

12:21пожаловаться #12

VS

Vasily Shabanov in Data Engineers

По объёмам и как конкретно из хадупа переливается — чуть позже скажу

источник

12:21пожаловаться #13

DZ

Dmitry Zuev in Data Engineers

Vasily Shabanov

BI — сторонняя компания занимается, со своим продуктом импортозамещённым. Они из пг забирают сами.

забираю то ладно, а варят у себя внутри или на пг?

источник

12:21пожаловаться #14

VS

Vasily Shabanov in Data Engineers

У вас уже есть подрядчик который все это делает?
Вы хотите у них забрать и переписать на спарк?

Подрядчик есть, но они тоже колеблются как именно они хотят свой инструмент делать.

источник

12:22пожаловаться #15

VS

Vasily Shabanov in Data Engineers

забираю то ладно, а варят у себя внутри или на пг?

Сейчас из хадупа всё переливается в PG и самое заковыристо-расчётное проводится там.

источник

12:23пожаловаться #16

VS

Vasily Shabanov in Data Engineers

Vasily Shabanov

Подрядчик есть, но они тоже колеблются как именно они хотят свой инструмент делать.

От их решения зависит то, где именно свою часть будем делать мы. В GP или Spark’е. Нам хочется в спарке

источник

12:24пожаловаться #17

DZ

Dmitry Zuev in Data Engineers

Vasily Shabanov

От их решения зависит то, где именно свою часть будем делать мы. В GP или Spark’е. Нам хочется в спарке

но если у вас уже звезда то я б GP выбрал

источник

12:26пожаловаться #18

DZ

Dmitry Zuev in Data Engineers

ибо зачем тогда мучатся и ее строить

источник

12:28пожаловаться #19

VS

Vasily Shabanov in Data Engineers

какие объемы?

Прирост ≈5kk записей в день, но проблема в том, что приходится делать пересчёт минимум за год. Обновился день, обсчитывается полностью весь год.

источник

12:28пожаловаться #20