Size: a a a

2019 July 11

RB

Ramzan Bekbulatov in Data Engineers
Рамиль Ахмадеев
посмотри в сторону Cassandra или ClickHouse
Пока думаю про ClickHouse, он справляется с усиленной загрузкой данных в себя, не в курсе?
источник

GP

Grigory Pomadchin in Data Engineers
druid есть еще но по перформансу я не скажу
источник

MB

Mikhail Butalin in Data Engineers
Рамиль Ахмадеев
посмотри в сторону Cassandra или ClickHouse
JSON хранить в ClickHouse ? чётасомневаюсь...
источник

RB

Ramzan Bekbulatov in Data Engineers
Mikhail Butalin
JSON хранить в ClickHouse ? чётасомневаюсь...
Ну, можем постараться и схему зафиксировать
источник

MB

Mikhail Butalin in Data Engineers
тут еще не обозначили размер этого JSON
источник

RB

Ramzan Bekbulatov in Data Engineers
Mikhail Butalin
тут еще не обозначили размер этого JSON
5-20 численных значений в одном джсоне
источник

GP

Grigory Pomadchin in Data Engineers
Ramzan Bekbulatov
5-20 численных значений в одном джсоне
по юз кейсу прям друид что тебе нужно
таймсерис квери хайперформансные

попробуй; если не пробовал - ничего не теряешь
источник

MB

Mikhail Butalin in Data Engineers
ябы его в колонки распарсил, тогда да должно норм зайти
источник

MB

Mikhail Butalin in Data Engineers
А по скорости заливки, ярд для клика норм должен зайти
источник

RB

Ramzan Bekbulatov in Data Engineers
Grigory Pomadchin
по юз кейсу прям друид что тебе нужно
таймсерис квери хайперформансные

попробуй; если не пробовал - ничего не теряешь
Гуглю :)
источник

RB

Ramzan Bekbulatov in Data Engineers
Mikhail Butalin
А по скорости заливки, ярд для клика норм должен зайти
а про Vertica что-то подскажете?
источник

RB

Ramzan Bekbulatov in Data Engineers
хотя, он платный
источник

S

Stanislav in Data Engineers
Grigory Pomadchin
по юз кейсу прям друид что тебе нужно
таймсерис квери хайперформансные

попробуй; если не пробовал - ничего не теряешь
судя по кейсу нагрузка -30 вставок в секунду
источник

S

Stanislav in Data Engineers
какой там хайперформанс
источник

GP

Grigory Pomadchin in Data Engineers
источник

MB

Mikhail Butalin in Data Engineers
Ramzan Bekbulatov
а про Vertica что-то подскажете?
сорян, нет
источник

AE

Alexey Evdokimov in Data Engineers
никто часом не знает, что надо сказать javassist'у, чтобы спарк не падал на десериализации лямбды, которая капчурится из класса, в котором надо подправить пару констант в рантайме?
источник

AE

Alexey Evdokimov in Data Engineers
сам спарк добавляет этим же самым жабассистом метод .$deserializeLambda$ в класс, а потом его зверски дёргает через рефлексию.
но что там в этом методе происходит, я чё-то не раскурил. и где его искать, или хотя бы узнать как он генерится...
источник

AE

Alexey Evdokimov in Data Engineers
ладно, если так нельзя, то подменим константы в классе, из которого они наследуются.

блин. копаться в байткоде такое себе занятие :/
источник

GP

Grigory Pomadchin in Data Engineers
Спасибо) Настроим бота попозже времени сейчас нет особо)
источник