Size: a a a

2017 June 01

GP

Grigory Pomadchin in Data Engineers
для чтения по диапазонам да
источник

GP

Grigory Pomadchin in Data Engineers
для записи баферед мутатор
источник

NK

ID:1373407 in Data Engineers
Grigory Pomadchin
для записи баферед мутатор
о, мутатор у меня есть.
источник

GP

Grigory Pomadchin in Data Engineers
кстате это хороший вопрос; потому что мне кажется имеет смысл отказываться от него уже (newAPIHadoopRDD).
источник

NK

ID:1373407 in Data Engineers
Grigory Pomadchin
кстате это хороший вопрос; потому что мне кажется имеет смысл отказываться от него уже (newAPIHadoopRDD).
в какую сторону? Я не стал коннекторы использовать, так как они показались мне дистро спесифик( сдх хдп)
источник

GP

Grigory Pomadchin in Data Engineers
на чтение
источник

GP

Grigory Pomadchin in Data Engineers
на запись точно мутатор
источник

GP

Grigory Pomadchin in Data Engineers
мм рекомендую ориентироваться на их родной спарк коннектор который будет в HBase 2.0
источник

NK

ID:1373407 in Data Engineers
Grigory Pomadchin
на запись точно мутатор
За мутатор спасибо, я агрегировал по nтыщ записей и писал , ну или пытался hfile генерировать
источник

GP

Grigory Pomadchin in Data Engineers
он намного быстрее на запись чем через хадупапирдд

на чтение не уверен; у Accumulo разницы не было _вроде_ но я не помню точно + мы контриубтили в аккумулу чтоб ускорить чтение.
источник

NK

ID:1373407 in Data Engineers
Grigory Pomadchin
мм рекомендую ориентироваться на их родной спарк коннектор который будет в HBase 2.0
источник

GP

Grigory Pomadchin in Data Engineers
источник

GP

Grigory Pomadchin in Data Engineers
hbase-spark 2.0.0-SNAPSHOT
источник

NK

ID:1373407 in Data Engineers
Grigory Pomadchin
hbase-spark 2.0.0-SNAPSHOT
вот это меня смутило atest commit 1700768 on 18 Feb
источник

GP

Grigory Pomadchin in Data Engineers
вот последний коммит
источник

GP

Grigory Pomadchin in Data Engineers
источник

GP

Grigory Pomadchin in Data Engineers
и он тупой)
источник

GP

Grigory Pomadchin in Data Engineers
ну это HBase, все медленно вяло.
источник

GP

Grigory Pomadchin in Data Engineers
CDH быстрее развивается?
источник

GP

Grigory Pomadchin in Data Engineers
источник