Телеграмм чат группы hadoopusers страница 2067

Всем привет. Подскажите, пожалуйста, метаданные для управлением загрузок pipeline и историю загрузок по опыту лучше хранить в отдельной СУБД или прямо в HDFS с Hive над ним. Сейчас используется Hadoop, загрузка через Spark.

лучше в отдельной базе, можно объединять например престой

источник

17:04пожаловаться #11

Alexey Evdokimov in Data Engineers

спсибо всем. знаю теперь, что напишу коммерсам в ответе для турецкого султана...

источник

17:07пожаловаться #12

Anton Kovalenko in Data Engineers

Alexey Evdokimov

хм, чё-то в гринпламе постгис какой-то сильно дремучий вообще. чуть ли не десятилетней давности, ужс

Это ни о чем не говорит )) GP - это честное MPP. Задумывалась как софтверная Teradata

источник

17:07пожаловаться #13

Anton Zadorozhniy in Data Engineers

Anton Kovalenko

Это ни о чем не говорит )) GP - это честное MPP. Задумывалась как софтверная Teradata

терадата это софтверная терадата))

источник

17:07пожаловаться #14

Alexey Evdokimov in Data Engineers

...сделаем свою терадату. с нардами и поэтэссами.

источник

17:08пожаловаться #15

Alexey Evdokimov in Data Engineers

но карманный вариант.

источник

17:08пожаловаться #16

Anton Kovalenko in Data Engineers

Alexey Evdokimov

хм, чё-то в гринпламе постгис какой-то сильно дремучий вообще. чуть ли не десятилетней давности, ужс

Если с GP до этого не сталкивались и опыта нет - лучше почитать и послушать знающих людей. Если что, вопросы можно тут задавать:
https://t.me/greenplum_russia

Greenplum

Обсуждаем вопросы по эксплуатации, разработке и развитию MPP RDBMS Greenplum

Правила чата:
- Без оскорблений
- Без рекламы
- Без буллщита
- Разрешён хантинг только на Greenplum-related позиции

источник

17:08пожаловаться #17

Alexey Evdokimov in Data Engineers

когда до этого ещё дойдёт. если и будет делать, то сначала прототип на существующем велосипеде, потом уж реально подбирать чт-то для желаемого времени отклика

источник

17:10пожаловаться #18

Alexey Evdokimov in Data Engineers

и вряд ли я сам. наймём кого-нить. если найдём вообще

источник

17:11пожаловаться #19

Алексей in Data Engineers

в оракле с 12 версии есть шардирование серверов, если есть однозначно данные разбить на шарды, то можно говорить что он горизонтально масштабируется

источник

17:18пожаловаться #20