Телеграмм чат группы hadoopusers страница 3095

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Engineers

2182 membersпожаловаться на группу

2020 December 25

DZ

Dmitry Zuev in Data Engineers

отвечаю

источник

18:57пожаловаться #1

DZ

Dmitry Zuev in Data Engineers

никак

источник

18:57пожаловаться #2

e

er@essbase.ru in Data Engineers

есть много вариантов- спарк джобы тестировать, качество данных , наполнение вообщем есть где разгуляться))

Есть ли дельная статья про это ?

источник

18:58пожаловаться #3

DZ

Dmitry Zuev in Data Engineers

какой конретный кейс?

источник

18:58пожаловаться #4

AB

Andrey Bel in Data Engineers

Есть ли дельная статья про это ?

про тестирование спарка много инфы- например вариант чтобы у тебя датафреймы на выходе были одинаковые и тд

источник

18:58пожаловаться #5

DZ

Dmitry Zuev in Data Engineers

это путь в никуда

источник

18:59пожаловаться #6

DZ

Dmitry Zuev in Data Engineers

обычно есть какая то бизнес логика которая отцепляется от спарка

источник

19:00пожаловаться #7

AB

Andrey Bel in Data Engineers

это путь в никуда

я узаю кейс похожий на кейсы из веб - у меня спарк джоба разбита на вызовы методов и при тестировании я могу увидеть если были изменения и тест свалится

источник

19:00пожаловаться #8

DZ

Dmitry Zuev in Data Engineers

интеграциионные тесты на не смоканых сервисах?

источник

19:01пожаловаться #9

ME

Max Efremov in Data Engineers

обычно всех волнует как тестировать 500 строк sql

Подать на вход семплы и посмотреть выход? Ну и разбить 500 строк на 20 функций и тестировать отдельно, если spark sql

источник

19:01пожаловаться #10

ME

Max Efremov in Data Engineers

Я сейчас пытаюсь юнит тесты такого типа написать как раз, вроде такие подходы используются

источник

19:02пожаловаться #11

DZ

Dmitry Zuev in Data Engineers

sql плохо декомпозится

источник

19:02пожаловаться #12

DZ

Dmitry Zuev in Data Engineers

если можно побить то да, норм

источник

19:02пожаловаться #13

DZ

Dmitry Zuev in Data Engineers

Но подход на семплах не всегда работает, тк в семпле может не быть корнер кейса

источник

19:03пожаловаться #14

N

Nikita Blagodarnyy in Data Engineers

интеграциионные тесты на не смоканых сервисах?

можно на тестовых/девовых. но данных туда налить-это геморно.

источник

19:03пожаловаться #15

AB

Andrey Bel in Data Engineers

Подать на вход семплы и посмотреть выход? Ну и разбить 500 строк на 20 функций и тестировать отдельно, если spark sql

ну условино
val df = run()save("testData")
def run() ={
foo1()
foo2()
foo3()}
.
testDF = run()

testDf assert spark.read(testData)

источник

19:03пожаловаться #16

ME

Max Efremov in Data Engineers

Но подход на семплах не всегда работает, тк в семпле может не быть корнер кейса

Это уже качество написанного теста, всегда можно написать плохие тесты, которые учитывают 10% вариантов

источник

19:03пожаловаться #17

DZ

Dmitry Zuev in Data Engineers

Nikita Blagodarnyy

можно на тестовых/девовых. но данных туда налить-это геморно.

но если есть спека на сервис то я бы отвязал. поднимал бы дамб свой

источник

19:04пожаловаться #18

DZ

Dmitry Zuev in Data Engineers

Это уже качество написанного теста, всегда можно написать плохие тесты, которые учитывают 10% вариантов

тогда что такое семпл. Если мы говорим про рандомную выборку с прода, то это работать не будет

источник

19:04пожаловаться #19

AB

Andrey Bel in Data Engineers

интеграциионные тесты на не смоканых сервисах?

юнит тесты

источник

19:05пожаловаться #20