Телеграмм чат группы hadoopusers страница 1492

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Engineers

1724 membersпожаловаться на группу

2019 July 31

AZ

Anton Zadorozhniy in Data Engineers

Инженеры, как я понимаю, единственное феникс не может нормально кастить числовые типы с hbase. И для того, чтобы типы там работали,нужно писать все через феникс?

В хбейз нет типов

источник

21:47пожаловаться #1

RI

Rustam Iksanov in Data Engineers

Anton Zadorozhniy

В хбейз нет типов

Это я понимаю, что он хранит все в байтах. Просто когда делаешь external table в hive, то там он валидно преобразует байты в типы. а вот с феникс такой поворот не прошел.

источник

21:48пожаловаться #2

AZ

Anton Zadorozhniy in Data Engineers

Это я понимаю, что он хранит все в байтах. Просто когда делаешь external table в hive, то там он валидно преобразует байты в типы. а вот с феникс такой поворот не прошел.

Это звучит как проблема хайв а не финикс, у меня было несколько финиксов и там не было проблем с интами и лонгами

источник

21:49пожаловаться #3

AZ

Anton Zadorozhniy in Data Engineers

Финикс это олтп база, ему хайв не нужен

источник

21:50пожаловаться #4

RI

Rustam Iksanov in Data Engineers

Anton Zadorozhniy

Это звучит как проблема хайв а не финикс, у меня было несколько финиксов и там не было проблем с интами и лонгами

Тогда опишу свою проблему. Есть таблица в hbase, которая записана через spark коннектор. Она читается через спарк и через external table в hive, но при попытке сделать на нее view или таблицу в фениксе все числовые типы становятся не валидны.

источник

21:51пожаловаться #5

AZ

Anton Zadorozhniy in Data Engineers

Тогда опишу свою проблему. Есть таблица в hbase, которая записана через spark коннектор. Она читается через спарк и через external table в hive, но при попытке сделать на нее view или таблицу в фениксе все числовые типы становятся не валидны.

Записано через phoenix-spark?

источник

21:52пожаловаться #6

RI

Rustam Iksanov in Data Engineers

Anton Zadorozhniy

Записано через phoenix-spark?

нет, через hbase-spark-connector

источник

21:53пожаловаться #7

S

Stanislav in Data Engineers

Фишка в том что атомарный апдейт (скажем один заказ - не будет весить 16мб), но внутри одного клиента мы можем иметь очень много заказов, и тогда они сильно больше будут
А выполнять джойн клиенты-на-заказы каждый раз не хочется

композитный кей - клиент-заказ
тогда записи становятся мелкими и операции простыми
+получаем бонус в хбейзе с быстрым сканом по клиентам

источник

21:55пожаловаться #8

AZ

Anton Zadorozhniy in Data Engineers

нет, через hbase-spark-connector

Пишите через phoenix-spark, и читайте хайвом через Phoenix storage handler

источник

21:56пожаловаться #9

S

Stanislav in Data Engineers

композитный кей - клиент-заказ
тогда записи становятся мелкими и операции простыми
+получаем бонус в хбейзе с быстрым сканом по клиентам

типа одна операция скана выдаст сразу все заказы

источник

21:57пожаловаться #10

RI

Rustam Iksanov in Data Engineers

Anton Zadorozhniy

Пишите через phoenix-spark, и читайте хайвом через Phoenix storage handler

А почему читать через hive? Для меня преимуществом phoenix перед hive вторичные индексы в hbase. Будут ли они использоваться? И в чем вообще выйгрыш читать через phoenix storage handler

источник

21:58пожаловаться #11

AZ

Anton Zadorozhniy in Data Engineers

А почему читать через hive? Для меня преимуществом phoenix перед hive вторичные индексы в hbase. Будут ли они использоваться? И в чем вообще выйгрыш читать через phoenix storage handler

Вы написали что читали хайвом, я не понял зачем. Собственно можно читать напрямую финиксом

источник

21:59пожаловаться #12

AZ

Anton Zadorozhniy in Data Engineers

Трогать через хайв надо если вам нужно джоин с данными из хдфс, это антипаттерн и так делать не стоит

источник

22:01пожаловаться #13

RI

Rustam Iksanov in Data Engineers

Anton Zadorozhniy

Вы написали что читали хайвом, я не понял зачем. Собственно можно читать напрямую финиксом

Простите, ввел в заблуждение. Просто hive уже был на кластере, поэтому изначально надеялся обойтись его external table для доступа аналитикам и внешним системам. Но время запросов не порадовало. И поэтому поднял феникс.

источник

22:01пожаловаться #14

RI

Rustam Iksanov in Data Engineers

Anton Zadorozhniy

Вы написали что читали хайвом, я не понял зачем. Собственно можно читать напрямую финиксом

В том то и дело нужны join + вторичные индексы

источник

22:01пожаловаться #15

AZ

Anton Zadorozhniy in Data Engineers

В том то и дело нужны join + вторичные индексы

Финикс это олтп база, там возможны только простые джоины когда одна сторона очень маленькая (например редуцирована через where), для больших merge join он не подходит

источник

22:03пожаловаться #16

RI

Rustam Iksanov in Data Engineers

Anton Zadorozhniy

Финикс это олтп база, там возможны только простые джоины когда одна сторона очень маленькая (например редуцирована через where), для больших merge join он не подходит

Что тогда для ускорения hive поднять llap вместо tez ?

источник

22:04пожаловаться #17

AZ

Anton Zadorozhniy in Data Engineers

Что тогда для ускорения hive поднять llap вместо tez ?

СУБД нормальную пробовали?

источник

22:04пожаловаться #18

S

Stanislav in Data Engineers

Что тогда для ускорения hive поднять llap вместо tez ?

из крайности в крайность. ни феникс не спасет, ни ллап

источник

22:05пожаловаться #19

S

Stanislav in Data Engineers

один над кв сделан, второй над файлами
если нужна бд - возьмите бд

источник

22:05пожаловаться #20