Size: a a a

2020 April 01

AK

Andrew Kochen in Data Engineers
Dmitry Zuev
льете через jdbc?
да, через яндексовский jdbc драйвер
источник

DZ

Dmitry Zuev in Data Engineers
Andrew Kochen
да, через яндексовский jdbc драйвер
свой рдд?
источник

DZ

Dmitry Zuev in Data Engineers
или только врайтер?
источник

AK

Andrew Kochen in Data Engineers
тоже нет пока. Пока врайтер только
источник

DZ

Dmitry Zuev in Data Engineers
Andrew Kochen
пушдауна пока не было. Автоматически схему определяет и заливает
а в чем фишка тогда без пушдауна?
источник

DZ

Dmitry Zuev in Data Engineers
Andrew Kochen
тоже нет пока. Пока врайтер только
можешь пошарить?
источник

AK

Andrew Kochen in Data Engineers
Dmitry Zuev
а в чем фишка тогда без пушдауна?
как такового пушдауна нет, был небольшой костыль, позволяющий прокинуть кастомное условие на вычитку
источник

AK

Andrew Kochen in Data Engineers
Dmitry Zuev
можешь пошарить?
пошарить пока не могу, общаюсь с фирмой, чтобы заопенсорсили
источник

DZ

Dmitry Zuev in Data Engineers
ну ок, ты инсертами делал или через tsv/orc?
источник

AK

Andrew Kochen in Data Engineers
в основном - это просто удобный API для спарка, чтобы можно было написать типа
df.write
 .batchSize()
 .shardBy(...)
 //otherSettings
 .clickhouse(cluster, url, table)
источник

AK

Andrew Kochen in Data Engineers
Dmitry Zuev
ну ок, ты инсертами делал или через tsv/orc?
через jdbc драйвер, он инсерты делает, насколько я знаю
источник

DZ

Dmitry Zuev in Data Engineers
думаю да. просто у меня не получилось тупо подсунуть драйвер и делать write.jdbc
источник

AK

Andrew Kochen in Data Engineers
тоже так пытался, это не сработает никак)
источник

DZ

Dmitry Zuev in Data Engineers
угу ддл ебаный
источник

S

Sergey in Data Engineers
Dmitry Zuev
а кто нибудь дружил Clickhouse и спарк
Мы в итоге на Flink перешли для этого
источник

DZ

Dmitry Zuev in Data Engineers
Sergey
Мы в итоге на Flink перешли для этого
чем помогло?
источник

AK

Andrew Kochen in Data Engineers
ну мы эту штуку пилили, пока еще не было движка HDFS в КХ. Сейчас, возможно, это не было бы так актуально. Однако все пайпланы в фирме, насколько я знаю , работают через этот плагинчик)
источник

S

Sergey in Data Engineers
Dmitry Zuev
чем помогло?
Есть готовый ivi sink
источник

DZ

Dmitry Zuev in Data Engineers
Andrew Kochen
ну мы эту штуку пилили, пока еще не было движка HDFS в КХ. Сейчас, возможно, это не было бы так актуально. Однако все пайпланы в фирме, насколько я знаю , работают через этот плагинчик)
блин, у меня gs, и это боль
источник

AK

Andrew Kochen in Data Engineers
Dmitry Zuev
блин, у меня gs, и это боль
если хочешь, могу в личку скинуть, когда(если) заопенсорсят
источник