Size: a a a

2020 February 20

N

Nikita Blagodarnyy in Data Engineers
Его не я использую. Его использует процессинговая система.
источник

N

Nikita Blagodarnyy in Data Engineers
А я только данные из нее в реплику получаю.
источник

AZ

Anton Zadorozhniy in Data Engineers
А почему им не читать тогда же?
источник

N

Nikita Blagodarnyy in Data Engineers
Anton Zadorozhniy
А если не секрет зачем вы вообще Финикс используете? Напрямик будет быстрее, надежнее и гибче
Быстрее и надежнее, но сложнее. Поэтому, видимо, мои визави в какой-то момент решили , что быстрее будет обмазаться jdbcTemplate-ами и так жить. Хотя это только предположение, может еще какие-то консерны были.
источник

N

Nikita Blagodarnyy in Data Engineers
Anton Zadorozhniy
А почему им не читать тогда же?
Потому что нужно выделять инкремент по системному тайстампу. Его вытащить в феникс в этой версии невозможно, а в следующих крайне геморройно и с большими ограничениями.
источник

AZ

Anton Zadorozhniy in Data Engineers
Ясно, соболезную
источник

AZ

Anton Zadorozhniy in Data Engineers
Это будет очень secure job, бежать за тем что там создатели Финикса напридумывали и разбирать за ними
источник

AZ

Anton Zadorozhniy in Data Engineers
И неблагодарная работа
источник

N

Nikita Blagodarnyy in Data Engineers
Сейчас приходится упражняться с CopyTable map-reduce, который умеет в таймстампы. Вот чтобы попробовать от него избавиться я и пилю RowMapper, который данные из скана распирожит в человеческий вид.
источник

N

Nikita Blagodarnyy in Data Engineers
Anton Zadorozhniy
Это будет очень secure job, бежать за тем что там создатели Финикса напридумывали и разбирать за ними
Так я их же методы и использую в декодировании. Не свои же писать.
источник

AB

Alexander Batyrshin in Data Engineers
Nikita Blagodarnyy
Я сейчас обратную задачу решаю, как прочитать из hbase написанное фениксом. Строки читаются на ура, числа как-то нестабильно. Нихрена непонятно, что за оффсет используется во всех методах. Если кто понимает-заделитесь.
феникс инвертирует знаковый бит что бы числа могли быть отсортированы в лексикографическом порядке корректно
источник

AB

Alexander Batyrshin in Data Engineers
INTEGER Mapped to java.lang.Integer. The binary representation is a 4 byte integer with the sign bit flipped (so that negative values sorts before positive values).
источник

AB

Alexander Batyrshin in Data Engineers
BIGINT Mapped to java.lang.Long. The binary representation is an 8 byte long with the sign bit flipped (so that negative values sorts before positive values).
источник

AB

Alexander Batyrshin in Data Engineers
etc
источник
2020 February 21

N

Nikolay in Data Engineers
Nikita Blagodarnyy
Я сейчас обратную задачу решаю, как прочитать из hbase написанное фениксом. Строки читаются на ура, числа как-то нестабильно. Нихрена непонятно, что за оффсет используется во всех методах. Если кто понимает-заделитесь.
источник

AZ

Anton Zadorozhniy in Data Engineers
Господа хорошие, а у кого много коллег питонистов и джавистов/скалистов пишут под датафлоу, вы где-то видели или делали системное сравнение по производительности этих двух СДК?
источник

PA

Panchenko Andrey in Data Engineers
У меня на пайтоне. Сравнения не делал
источник

O

Oleg in Data Engineers
Прочитал дискуссию выше по поводу параллельного обучения моделей с максимальной утилизацией, а чем плох вариант вызывать в udf model.fit(), позаботившись предварительно, чтобы данные были локально на ноде с экзекутором?
источник

N

Nikita Blagodarnyy in Data Engineers
Благодарочка.
источник

BK

Brusе Kawabata in Data Engineers
Почему если хочешь использовать spark-avro, то нужно его подключать через --packages ?
источник