Size: a a a

2020 February 13

Е

Евгений in Data Engineers
читай весь тред пожалуйста
источник

A

Anton Kovalenko in Data Engineers
Alexey Evdokimov
про то и речь. это фигня, ни о чём совсем
Поэтому и говорю - надо знать детали, чтобы что-то конкретное предлагать )
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
у меня есть клиент с 3 ПБ в редшифте хранилищем, в принципе не жалуются, мб SQL научился масштабироваться?
Богатый :)
источник

AE

Alexey Evdokimov in Data Engineers
Anton Kovalenko
Поэтому и говорю - надо знать детали, чтобы что-то конкретное предлагать )
а с геодатой всегда проблемы, не было бы их, не пришлось бы столько велосипедить. в гисах всегда куча всякой самописной гадости
источник

A

Anton Kovalenko in Data Engineers
Alexey Evdokimov
а с геодатой всегда проблемы, не было бы их, не пришлось бы столько велосипедить. в гисах всегда куча всякой самописной гадости
Яндекс.Такси использует сразу все 3 компонента, которые и на нашем митапе рассматриваются. Возможно чем-то одним в таких задачах и не обойтись
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
Богатый :)
так столько данных появляются не от сырости, бизнес деньги приносит
источник

AE

Alexey Evdokimov in Data Engineers
хм, чё-то в гринпламе постгис какой-то сильно дремучий вообще. чуть ли не десятилетней давности, ужс
источник

AZ

Anton Zadorozhniy in Data Engineers
думаю вам сразу надо смотреть на инмемори, и писать сверху свой сервис
источник

S

Stanislav in Data Engineers
так а нужна там база данных то вообще?
источник

AE

Alexey Evdokimov in Data Engineers
мну озадачилсо.
источник

AZ

Anton Zadorozhniy in Data Engineers
Nikita Bakanchev
Всем привет. Подскажите, пожалуйста, метаданные для управлением загрузок pipeline и историю загрузок по опыту лучше хранить в отдельной СУБД или прямо в HDFS с Hive над ним. Сейчас используется Hadoop, загрузка через Spark.
лучше в отдельной базе, можно объединять например престой
источник

AE

Alexey Evdokimov in Data Engineers
спсибо всем. знаю теперь, что напишу коммерсам в ответе для турецкого султана...
источник

A

Anton Kovalenko in Data Engineers
Alexey Evdokimov
хм, чё-то в гринпламе постгис какой-то сильно дремучий вообще. чуть ли не десятилетней давности, ужс
Это ни о чем не говорит )) GP - это честное MPP. Задумывалась как софтверная Teradata
источник

AZ

Anton Zadorozhniy in Data Engineers
Anton Kovalenko
Это ни о чем не говорит )) GP - это честное MPP. Задумывалась как софтверная Teradata
терадата это софтверная терадата))
источник

AE

Alexey Evdokimov in Data Engineers
...сделаем свою терадату. с нардами и поэтэссами.
источник

AE

Alexey Evdokimov in Data Engineers
но карманный вариант.
источник

A

Anton Kovalenko in Data Engineers
Alexey Evdokimov
хм, чё-то в гринпламе постгис какой-то сильно дремучий вообще. чуть ли не десятилетней давности, ужс
Если с GP до этого не сталкивались и опыта нет - лучше почитать и послушать знающих людей. Если что, вопросы можно тут задавать:
https://t.me/greenplum_russia
источник

AE

Alexey Evdokimov in Data Engineers
когда до этого ещё дойдёт. если и будет делать, то сначала прототип на существующем велосипеде, потом уж реально подбирать чт-то для желаемого времени отклика
источник

AE

Alexey Evdokimov in Data Engineers
и вряд ли я сам. наймём кого-нить. если найдём вообще
источник

А

Алексей in Data Engineers
в оракле с 12 версии есть шардирование серверов, если есть однозначно данные разбить на шарды, то можно говорить что он горизонтально масштабируется
источник