Size: a a a

2020 February 20

EN

Eldar Nezametdinov in Data Engineers
Anton Zadorozhniy
в любом случае конкретный тормоз это не повод сразу менять СУБД)
не я просто хотел узнать какие еще юзают\другие подходы)
источник

EN

Eldar Nezametdinov in Data Engineers
Andrey Smirnov
как вставляли, batch или по одной записи?
zeppelin spark read orc transform write format phoenix..
dynamic allocation 200max executors
источник

AS

Andrey Smirnov in Data Engineers
Eldar Nezametdinov
zeppelin spark read orc transform write format phoenix..
dynamic allocation 200max executors
осталось понять как пишет феникс
источник

AZ

Anton Zadorozhniy in Data Engineers
Eldar Nezametdinov
не я просто хотел узнать какие еще юзают\другие подходы)
ну для вашего кейса наверное можно на монгу посмотреть, хотя такое тоже...
источник

AS

Andrey Smirnov in Data Engineers
а так я вспоминаю что мы писали код для спарка, для того чтобы он bulk писал сразу в hbase
источник

AZ

Anton Zadorozhniy in Data Engineers
Eldar Nezametdinov
zeppelin spark read orc transform write format phoenix..
dynamic allocation 200max executors
как вариант - сохранять из спарка в файл и потом phoenix bulk load tool вызывать, но он вроде умел только csv и json
источник

AZ

Anton Zadorozhniy in Data Engineers
Andrey Smirnov
осталось понять как пишет феникс
построчно он пишет
источник

AS

Andrey Smirnov in Data Engineers
Anton Zadorozhniy
построчно он пишет
кажется мы нашли тормоза, hbase не виноват
источник

AZ

Anton Zadorozhniy in Data Engineers
Andrey Smirnov
кажется мы нашли тормоза, hbase не виноват
финикс тоже тот еще подарок
источник

AZ

Anton Zadorozhniy in Data Engineers
там могут быть какие-то вторичные индексы, RI и куча другой логики, которая может тормозить
источник

K

KrivdaTheTriewe in Data Engineers
я коннектором писал в хбейз
источник

K

KrivdaTheTriewe in Data Engineers
работал прям напрямую
источник

K

KrivdaTheTriewe in Data Engineers
дажсо стримингом работает
источник

RI

Rustam Iksanov in Data Engineers
При использовании phoenix нельзя в hbase писать напрямую, как я помню феникс пишет в обратно порядке байты. Можно писать файлы как asPhoenixTable и потом их закидывать
источник

N

Nikita Blagodarnyy in Data Engineers
Rustam Iksanov
При использовании phoenix нельзя в hbase писать напрямую, как я помню феникс пишет в обратно порядке байты. Можно писать файлы как asPhoenixTable и потом их закидывать
Строки можно через Bytes.toBytes(), числа через nested static class типа (PInteger, PVarchar и т.п.) можно кодировать/декодировать.
источник

RI

Rustam Iksanov in Data Engineers
Nikita Blagodarnyy
Строки можно через Bytes.toBytes(), числа через nested static class типа (PInteger, PVarchar и т.п.) можно кодировать/декодировать.
Буду знать, когда нужно было не нашел инфу как сконвертировать
источник

N

Nikita Blagodarnyy in Data Engineers
источник

N

Nikita Blagodarnyy in Data Engineers
Насколько я понимаю, это вот тут
источник

N

Nikita Blagodarnyy in Data Engineers
Я сейчас обратную задачу решаю, как прочитать из hbase написанное фениксом. Строки читаются на ура, числа как-то нестабильно. Нихрена непонятно, что за оффсет используется во всех методах. Если кто понимает-заделитесь.
источник

AZ

Anton Zadorozhniy in Data Engineers
Nikita Blagodarnyy
Я сейчас обратную задачу решаю, как прочитать из hbase написанное фениксом. Строки читаются на ура, числа как-то нестабильно. Нихрена непонятно, что за оффсет используется во всех методах. Если кто понимает-заделитесь.
А если не секрет зачем вы вообще Финикс используете? Напрямик будет быстрее, надежнее и гибче
источник