Телеграмм чат группы hadoopusers страница 2900

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Engineers

2007 membersпожаловаться на группу

2020 October 28

AB

Alexander Batyrshin in Data Engineers

Формально они там в master комитят, но новую версию так и не выпустили. Причем 5-ка была под 2.0 который уже устарел )

источник

22:19пожаловаться #1

AB

Alexander Batyrshin in Data Engineers

Ага, сразу после релиза наступила тишина. Зачем релиз был - непонятно. Для красивых циферок в хдп3 что-ли

Основная идея была релизнуться для HBase-2. Но HBase-2 не особо в фаворе, многие на 1.2 до сих пор сидят и не особо планируют обновляться

источник

22:20пожаловаться #2

S

Stanislav in Data Engineers

Alexander Batyrshin

Формально они там в master комитят, но новую версию так и не выпустили. Причем 5-ка была под 2.0 который уже устарел )

Не знал, спасибо. То есть можно глянуть, может есть фиксы, которые нужны. Собирать только не хочется :(

источник

22:22пожаловаться #3

AB

Alexander Batyrshin in Data Engineers

В мастер много чего нового уже влили. Включая консистентные индексы и прочее

источник

22:22пожаловаться #4

SS

Sergey Sheremeta in Data Engineers

Не знал, спасибо. То есть можно глянуть, может есть фиксы, которые нужны. Собирать только не хочется :(

источник

22:23пожаловаться #5

AB

Alexander Batyrshin in Data Engineers

Вроде даже поддержку HBase-2.2 комитили

источник

22:23пожаловаться #6

S

Stanislav in Data Engineers

Спасибо

источник

22:25пожаловаться #7

AS

Andrey Smirnov in Data Engineers

Sergey Sheremeta

а чего тут так тихо?

не желаете поговорить об HBase?
как из него выGETывать большие пачки данных из Spark?

"угадываем" по ключу region server, группируем ключи, читаем

источник

22:30пожаловаться #8

AB

Alexander Batyrshin in Data Engineers

"угадываем" по ключу region server, группируем ключи, читаем

А это все делает HBase client

источник

22:31пожаловаться #9

AZ

Anton Zadorozhniy in Data Engineers

Sergey Sheremeta

а чего тут так тихо?

не желаете поговорить об HBase?
как из него выGETывать большие пачки данных из Spark?

так же как и небольшие пачки, get или scan

источник

22:31пожаловаться #10

AZ

Anton Zadorozhniy in Data Engineers

ну мб какой-то пушдаун на копроцессорах

источник

22:32пожаловаться #11

AS

Andrey Smirnov in Data Engineers

Alexander Batyrshin

А это все делает HBase client

а как вы его из спарка используете?

источник

22:32пожаловаться #12

AB

Alexander Batyrshin in Data Engineers

а как вы его из спарка используете?

У Сережи там HBase Connector используется. Он сплитит как раз по регионом, потому я думаю что HBase Client (которые в конекторе используется) даже ничего особо группировать и не нужно

источник

22:34пожаловаться #13

AZ

Anton Zadorozhniy in Data Engineers

hbase connector это тоже самое что org.apache.spark.sql.execution.datasources.hbase ?

источник

22:35пожаловаться #14

AS

Andrey Smirnov in Data Engineers

Alexander Batyrshin

У Сережи там HBase Connector используется. Он сплитит как раз по регионом, потому я думаю что HBase Client (которые в конекторе используется) даже ничего особо группировать и не нужно

группируем я имел ввиду кастомное парционирование

источник

22:35пожаловаться #15

AB

Alexander Batyrshin in Data Engineers

@ssheremeta тут уже к тебе вопросы про наш датасорус HBase

источник

22:36пожаловаться #16

AS

Andrey Smirnov in Data Engineers

Anton Zadorozhniy

hbase connector это тоже самое что org.apache.spark.sql.execution.datasources.hbase ?

вот да, какой именно коннектор? @ox62ash

источник

22:36пожаловаться #17

AZ

Anton Zadorozhniy in Data Engineers

вообще кмк если есть прям большой спарковый ворклоад поверх данных hbase - мб куда-то еще эти данные писать, а то производительность это полбеды, есть же еще вопросы целостности, модели, изоляции

источник

22:37пожаловаться #18

SS

Sergey Sheremeta in Data Engineers

а я сейчас даже без spark-hbase коннектора, голым HBase Client API пытаюсь сделать мульти-гет

источник

22:38пожаловаться #19

AZ

Anton Zadorozhniy in Data Engineers

а это спарк стриминг, у вас лукапы просто, или батч?

источник

22:38пожаловаться #20