Size: a a a

2020 December 25

AZ

Anton Zadorozhniy in Data Engineers
Почты везде такие многопрофильные, в нашей деревне почта делает ещё мильон справок, нотариальные услуги, и черт знает что ещё.. у них тоже большое аналитическое хозяйство (на терадате :))
источник

DZ

Dmitry Zuev in Data Engineers
Max Efremov
Ну как бы логично разделять как везде, data не особенные же, что тестировать не надо)
и как из работа организована? они пилят семплы, и ожидаемые результаты?
источник

ME

Max Efremov in Data Engineers
Увы, не знаю( не сталкивался с ними в проекте, у нас я сам сейчас пишу тесты, пока задач нет от бизнеса
источник

DZ

Dmitry Zuev in Data Engineers
мне просто даже интересно как искать тестировщиков которые будут пытаться ушатать етл каким нибудь late arriving dimension
источник

DZ

Dmitry Zuev in Data Engineers
ну то есть получется сначала нужно сделат data profiling, потом разобрать бизнес кейс, собрать датасеты и в уме посчитать выхлоп
источник

NB

Nikita Bakanchev in Data Engineers
обычно они по ТЗ sql писали в ватерфоле
источник

NB

Nikita Bakanchev in Data Engineers
в аджайле хз )
источник

DZ

Dmitry Zuev in Data Engineers
какой скл?
источник

DZ

Dmitry Zuev in Data Engineers
У соседней команды были такие тестеры, которые уходили через 2-3 месяца, когда понимали что от тестирования здесь только ассерт в конце
источник

DZ

Dmitry Zuev in Data Engineers
натурально, им говорили, найдите свой способ это считать и проверите что наш работает правильно
источник

DZ

Dmitry Zuev in Data Engineers
источник

NB

Nikita Bakanchev in Data Engineers
Dmitry Zuev
какой скл?
На этапе приемки по бизнес case описанному составлялся sql (я сейчас про data mart), что etl реализован корректно
источник

NB

Nikita Bakanchev in Data Engineers
Dmitry Zuev
натурально, им говорили, найдите свой способ это считать и проверите что наш работает правильно
да примерно так и было )
источник

NB

Nikita Bakanchev in Data Engineers
но это бородатый 2015-ые
источник

AZ

Anton Zadorozhniy in Data Engineers
Dmitry Zuev
мне просто даже интересно как искать тестировщиков которые будут пытаться ушатать етл каким нибудь late arriving dimension
Полно мест где целевая задержка в витринах T - 30 (дней), там такие офицеры прочесывают данные, меняют процессы и модель если надо..
источник

DZ

Dmitry Zuev in Data Engineers
не совсем понял
источник

DZ

Dmitry Zuev in Data Engineers
Вот есть какой нибудь анализ churn rate или там ltv.
Аналитик придумал какую то формулу. Биайщики наговнякали sql.
Кто и какие тесты будет писать?
источник

AZ

Anton Zadorozhniy in Data Engineers
Dmitry Zuev
Вот есть какой нибудь анализ churn rate или там ltv.
Аналитик придумал какую то формулу. Биайщики наговнякали sql.
Кто и какие тесты будет писать?
Тут чаще не в части feature engineering, а по отчётности: разрезы отчетов бьются, по корректировкам старая отчетность не отъехала, немного master data management, в таком ключе
источник

AZ

Anton Zadorozhniy in Data Engineers
По бизнес метрикам которые идут в красивые отчеты (а не ML) обычно делают sanity checks и кросс-проверки: распределение и подозрительные всплески , динамику по истории, сравнение со схожими показателями и по рынку, как-то так
источник

AZ

Anton Zadorozhniy in Data Engineers
Это все не от хорошей жизни конечно
источник