Size: a a a

2019 July 04

AE

Alexey Evdokimov in Data Engineers
тут согласен
источник

AE

Alexey Evdokimov in Data Engineers
если хочешь пощупать бету, то щупаешь самостоятельно.
источник

AZ

Anton Zadorozhniy in Data Engineers
даже если релиз, EMR  до сих пор на Hadoop 2
источник

AE

Alexey Evdokimov in Data Engineers
эт да. но, опять же, если смотреть через cloud-colored glasses, то локально можно играться с любой версией, а при деплое в облаке всё равно юзаешь только ту, которая там доступна. не у всех есть свой датацентр или ресурсы для развёртывания с нуля на голых виртуалках :/
источник

O

Oleg in Data Engineers
Как считаете, в каких кейсах стоит использовать hbase а не hdfs + hive, помимо если нужны апдейты?
источник

AZ

Anton Zadorozhniy in Data Engineers
Oleg
Как считаете, в каких кейсах стоит использовать hbase а не hdfs + hive, помимо если нужны апдейты?
вы сравниваете несравнимое, hbase это почти базовый kv storage у которого api состоит из put/get/scan по ключу (никакого языка запросов), без модели данных (любая ячейка это массив байт для hbase); hive это движок запросов имитирующий РСУБД у которого все операции это full scan
источник

AZ

Anton Zadorozhniy in Data Engineers
мб hive поверх hbase, но сырой hbase с hive сравнивать трудно, как говорят это теплое с мягким
источник

AB

Andrei Boaghe in Data Engineers
Anton Zadorozhniy
мб hive поверх hbase, но сырой hbase с hive сравнивать трудно, как говорят это теплое с мягким
Не расскажите плиз, а в чём смысл hive поверх hbase? Это ведь не только для упрощения доступа (т.е. написания запросов)?
источник

AZ

Anton Zadorozhniy in Data Engineers
Andrei Boaghe
Не расскажите плиз, а в чём смысл hive поверх hbase? Это ведь не только для упрощения доступа (т.е. написания запросов)?
я видел такое пару раз в дикой природе, это был кейс когда есть поток изменений от источника, и их надо довольно быстро учитывать в результах запросов hive - в таком дизайне приложение пишет в hbase напрямую, а запросы пользователей всегда видят актуальные данные
источник

AZ

Anton Zadorozhniy in Data Engineers
но у такого решения масса недостатков, не рекомендую как стандартный подход
источник

AB

Andrei Boaghe in Data Engineers
понял, спасибо)
не будем так делать :)
источник

AZ

Anton Zadorozhniy in Data Engineers
правильно, возьмите лучше нормальную РСУБД)
источник

DS

Dmitriy Solodukha in Data Engineers
Anton Zadorozhniy
правильно, возьмите лучше нормальную РСУБД)
Нормальную это какую, например?
источник

AZ

Anton Zadorozhniy in Data Engineers
Dmitriy Solodukha
Нормальную это какую, например?
Teradata вот хорошо работает для аналитики))
источник

AZ

Anton Zadorozhniy in Data Engineers
но вообще выбор компонентов архитектуры - это процесс который сложно в чатике за 5 минут сделать
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
Teradata вот хорошо работает для аналитики))
есть нулефаер?
источник

K

KrivdaTheTriewe in Data Engineers
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
есть нулефаер?
я не знаю что это такое)
источник

K

KrivdaTheTriewe in Data Engineers
это мой плохой юмор(
источник

VS

Vladislav 👻 Shishkov in Data Engineers
Anton Zadorozhniy
Teradata вот хорошо работает для аналитики))
топлю за Vertica 😬
источник