Size: a a a

2021 August 20

ЕГ

Евгений Глотов... in Moscow Spark
И гораздо проще провалидировать схему в джисоне, чем в 100500 кейсклассах
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Но на каждом шаге
источник

ЕГ

Евгений Глотов... in Moscow Spark
А уж насколько легче её поправить в случае косяка...
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Нинасколько?
источник

NN

No Name in Moscow Spark
На каждом шаге - ты что имеешь в виду?
В общем-то, достаточно над сырьем это сделать.
источник

ПФ

Паша Финкельштейн... in Moscow Spark
И над каждым мапом и редьюсом и селектом
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Потому что в строках очень просто ошибиться
источник

B

BadRat in Moscow Spark
Обучаю скала спарку джунов, аналитеков и бизнес заказчиков. Никаких проблем вообще. Даём им ноутбук с скала-ядром и радуемся успехам
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Почти над любой операцией кроме фильтра
источник

ПФ

Паша Финкельштейн... in Moscow Spark
А на кейс-классах у тебя нету строк, только поля
источник

NN

No Name in Moscow Spark
Можешь пример привести?
Не понял (
источник

NN

No Name in Moscow Spark
У нас на такое времени нет, деньги хотят делать сразу, а не через n времени.
источник

B

BadRat in Moscow Spark
Неделя времени
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Ну вот ты делаешь
xxx.select("a", "b", "c"), потом приводишь "c" к инту чтобы к нему что-то добавить и всё падает. Потому что тебе нужен был не c, а d.
источник

NN

No Name in Moscow Spark
Ну, не знаю, кого вы набираете.
У нас гораздо больше времени часто уходит на обучение приличным образом работать хотя бы с пайспарком.
источник

ПФ

Паша Финкельштейн... in Moscow Spark
С типами ты не делаешь селекта, ты делаешь мап на какой-то кейс класс и в нём типы проставлены
источник

NN

No Name in Moscow Spark
Ну, ок.
Ты же не сразу в прод пихаешь код, так?
На тестовом сэмпле это делаешь небольшом, он падает.
Не виду в этом большой потери времени и нагрузки на кластер.
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Только наверное лучше не сложение, а деление
источник

ЕГ

Евгений Глотов... in Moscow Spark
Вы пишете код, а ребята задачи решают - сначала написали запрос, который решил задачу, а потом уже в прод ставят рабочий код заведомо
источник

B

BadRat in Moscow Spark
Прилично пайспарком? Что это значит вообще
источник