Size: a a a

Архитектура данных

2020 February 21

SS

Sergey Sheremeta in Архитектура данных
Скорее нельзя
источник

e

er@essbase.ru in Архитектура данных
во что упрусь ?  какой сценарий использования hbase ?
источник

S

Shadilan R16 MU Rostov in Архитектура данных
Hbase это кейвалью, причём я бы не сказал что любящий очень большие объемы
источник

S

Shadilan R16 MU Rostov in Архитектура данных
Мне кажется не самый лучший вариант для озера...
источник

e

er@essbase.ru in Архитектура данных
Shadilan R16 MU Rostov
Hbase это кейвалью, причём я бы не сказал что любящий очень большие объемы
обманули ? да ? а как же Hadoop ?
Очень большие это сколько ? терабайт ?
источник

VS

Vladislav 👻 Shishkov in Архитектура данных
er@essbase.ru
обманули ? да ? а как же Hadoop ?
Очень большие это сколько ? терабайт ?
Hbase работает на hdfs, но это не значит, что в это kv можно впихнуть все подряд
источник

VS

Vladislav 👻 Shishkov in Архитектура данных
Это глупо...
источник

VS

Vladislav 👻 Shishkov in Архитектура данных
Насчет размера, лично не видел, но говорят у крупных игроков есть большие кластеры, где в hbase лежит поисковый индекс
источник

S

Shadilan R16 MU Rostov in Архитектура данных
Hbase типичный кей валью с очень быстрым доступом по ключам. Терабайт это не много для hbase, но там есть особенности записи, которые могут сильно напрячь весь hbase.
источник

e

er@essbase.ru in Архитектура данных

Также эта СУБД подойдет для работы с данными по моделям машинного обучения (Machine Learning), организации корпоративных хранилищ и озер данных (Data Warehouse, Data Lake) с целью BI-аналитики [1]. В частности, именно так Apache HBase используется в российском отделении Раффайзен-банка [4].

вот такое нашел
источник

e

er@essbase.ru in Архитектура данных
источник

S

Shadilan R16 MU Rostov in Архитектура данных
Для спид слой hbase не плох. Для ml замечателен... Но чисто на hbase озеро не построить надо делить потоки. Hive + hbase мне кажется вполне не плохой идеей
источник

S

Shadilan R16 MU Rostov in Архитектура данных
Спасибо за статью почитаю на досуге
источник

S

Shadilan R16 MU Rostov in Архитектура данных
Кстати в статье тоже пишут про объёмы не большие для спид слоя
источник

e

er@essbase.ru in Архитектура данных
Shadilan R16 MU Rostov
Кстати в статье тоже пишут про объёмы не большие для спид слоя
что такое спид-слой , для каких задач он выделяется ... ?
источник

S

Shadilan R16 MU Rostov in Архитектура данных
Для данных нужных в кратчайшие сроки, возможно для стримингового етл и онлайн витрин
источник

PD

Phil Delgyado in Архитектура данных
Кстати, а где про data lake почитать? Практики, подходы, цели?
источник

e

er@essbase.ru in Архитектура данных
сейчас раздают free на 10 -дней
есть как книги так и видео на  НОРМАЛЬНОМ английском 🤓
источник

e

er@essbase.ru in Архитектура данных
источник

PD

Phil Delgyado in Архитектура данных
Спасибо. А можете посоветовать обзорные статьи?
источник