Size: a a a

2021 January 30

ПФ

Паша Финкельштейн... in Data Engineers
ООО, нифига себе! Посмотрю, спасибо
источник

АР

Андрей Романов... in Data Engineers
+spark-testing-base для написания тестов с embedded spark
источник

АР

Андрей Романов... in Data Engineers
Андрей Романов
+spark-testing-base для написания тестов с embedded spark
его можно юзать, я попробовал


но очень много оперативки тратится((((
источник

ПФ

Паша Финкельштейн... in Data Engineers
Ну можно просто эмбеддед Спарк запускать, но конечно это всё равно будет толсто
источник

АР

Андрей Романов... in Data Engineers
Андрей Романов
+spark-testing-base для написания тестов с embedded spark
а для флинка что-то подобное есть?

я прост его тоже изучать начал, но чёт непонятно как тестить
источник

АР

Андрей Романов... in Data Engineers
понятно, что он в основном для поточной обработки, но всё же
источник

СХ

Старый Хрыч... in Data Engineers
Андрей Романов
его можно юзать, я попробовал


но очень много оперативки тратится((((
и в итоге получается проще куб
источник

ПФ

Паша Финкельштейн... in Data Engineers
источник

A

Alex in Data Engineers
сразу Хрыч рассказывал про то что везде куб пихают где надо и не надо
сейчас рассказывает что нужно его пихать везде
источник

ПФ

Паша Финкельштейн... in Data Engineers
Есть вот такая штука, но я ещё не разобрался что это
источник

АР

Андрей Романов... in Data Engineers
Старый Хрыч
и в итоге получается проще куб
знаете, я пробовал запускать в контейнерах, и оперативной памяти тратилось еще больше

возможно у вас есть другой опыт, но в моем случае он нерелевантен
источник

ПФ

Паша Финкельштейн... in Data Engineers
Андрей Романов
знаете, я пробовал запускать в контейнерах, и оперативной памяти тратилось еще больше

возможно у вас есть другой опыт, но в моем случае он нерелевантен
Ну на маке в это играть вообще смерть, но макоюзеры ссзб
источник

СХ

Старый Хрыч... in Data Engineers
Alex
сразу Хрыч рассказывал про то что везде куб пихают где надо и не надо
сейчас рассказывает что нужно его пихать везде
если у тебя 80 кодеров, проще куб кластер с операторами под тесты, чем городить каждому кодеру инструкцию по разворачиванию этого локально
источник

ПФ

Паша Финкельштейн... in Data Engineers
Но вот прямо выглядит как равно тестирование пайплайнов
источник

АР

Андрей Романов... in Data Engineers
Андрей Романов
а для флинка что-то подобное есть?

я прост его тоже изучать начал, но чёт непонятно как тестить
Вот что нашёл на гитхабе, может кому пригодится

https://github.com/knaufk/flink-testing-pyramid
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
Вы ещё скажите что топики создаются вручную на кластере через Kafka-topics.sh
А вы как делаете
источник

K

KrivdaTheTriewe in Data Engineers
Grigory Pomadchin
а кто цепелин использует сейчас?
Оч хочу чтобы полинот развивался
источник

A

Alex in Data Engineers
KrivdaTheTriewe
Оч хочу чтобы полинот развивался
Когда его открыли я посмотрел и сказал нах-нах, вероятность что в опенсорсе полетит минимальна

Кастомная бинарная сериализация сделаная на скале для общения с кернелом

Это была очень плохая шутка

Хоть я и недолюблюваю протокол jupyter кернелов на zeromq, но её можно запустить и реализовать  где и как угодно, а тут у тебя попытка реализации и поддержки протокола без схемы (ладно бы там protobuf или трифт был внутри)
источник

A

Alex in Data Engineers
Запуск питона сразу запускается кернел на скале и уже она как-то дёргает питон процесс
источник

K

KrivdaTheTriewe in Data Engineers
Alex
Запуск питона сразу запускается кернел на скале и уже она как-то дёргает питон процесс
Питон процесс не запускается когда джупитер скала кернел  работает ?
источник