Size: a a a

2019 September 16

K

KrivdaTheTriewe in Data Engineers
Rustam Iksanov
сделал show на df и запустил job локально
Тогда попробуй слить стрим куда
источник

K

KrivdaTheTriewe in Data Engineers
И посмотреть работает ли локально
источник

K

KrivdaTheTriewe in Data Engineers
Rustam Iksanov
сделал show на df и запустил job локально
Даже не так , запусти стрим и какую нибудь простую функцию над кейсклассом
источник

K

KrivdaTheTriewe in Data Engineers
И слей локально
источник

RI

Rustam Iksanov in Data Engineers
KrivdaTheTriewe
Тогда попробуй слить стрим куда
Стрим как раз работает. Из него есть логгирование, по которому видно, что пришли данные и он запустил расчет.
источник

K

KrivdaTheTriewe in Data Engineers
Rustam Iksanov
Стрим как раз работает. Из него есть логгирование, по которому видно, что пришли данные и он запустил расчет.
Ну я бы все таки как то удостоверился , что данные не зануленные там в стриме,но не show, вообще терь больше конкретики нужно столы вам помочь
источник

RI

Rustam Iksanov in Data Engineers
java.lang.NullPointerException
       at org.apache.spark.sql.Dataset.join(Dataset.scala:912)
       at ru.model.HelperFunctions$.generateRow(HelperFunctions.scala:257)`` ошибка выглядит так, а код
 val someData =
     table
       .join(varsTab, Seq("col1", "col2", "col3"), "left_semi")      // 257 line
       .filter($"col4" <= dateSubtracted)```
источник

K

KrivdaTheTriewe in Data Engineers
Rustam Iksanov
java.lang.NullPointerException
       at org.apache.spark.sql.Dataset.join(Dataset.scala:912)
       at ru.model.HelperFunctions$.generateRow(HelperFunctions.scala:257)`` ошибка выглядит так, а код
 val someData =
     table
       .join(varsTab, Seq("col1", "col2", "col3"), "left_semi")      // 257 line
       .filter($"col4" <= dateSubtracted)```
А попробовать все таки операции над датасетом получилось и сохранить куда то результат операции ?
источник

RI

Rustam Iksanov in Data Engineers
KrivdaTheTriewe
А попробовать все таки операции над датасетом получилось и сохранить куда то результат операции ?
В этом месте при попытке show тоже npe
источник

K

KrivdaTheTriewe in Data Engineers
Rustam Iksanov
В этом месте при попытке show тоже npe
Потому что форсируются вычисления всего батча
источник

RI

Rustam Iksanov in Data Engineers
KrivdaTheTriewe
Потому что форсируются вычисления всего батча
как проверить, если попытка вычисления вызывает npe ?
источник

K

KrivdaTheTriewe in Data Engineers
Rustam Iksanov
как проверить, если попытка вычисления вызывает npe ?
Ну я рассказал как
источник

K

KrivdaTheTriewe in Data Engineers
Попробоватьчто нибудь сделать с датасетом вместо Джоина и сохранить результат операции
источник

RI

Rustam Iksanov in Data Engineers
KrivdaTheTriewe
Ну я рассказал как
сделать промежуточное сохрание в паркет?
источник

K

KrivdaTheTriewe in Data Engineers
Rustam Iksanov
сделать промежуточное сохрание в паркет?
Да
источник

UD

Uncel Duk in Data Engineers
Привет, у меня смешной вопрос. Есть какие-нибудь альтернативы hue ? Непонятно в какую сторону он развивается, система сборки просто огонь
источник

K

KrivdaTheTriewe in Data Engineers
Uncel Duk
Привет, у меня смешной вопрос. Есть какие-нибудь альтернативы hue ? Непонятно в какую сторону он развивается, система сборки просто огонь
Суперсет
источник

ME

Mikhail Epikhin in Data Engineers
KrivdaTheTriewe
Суперсет
источник

ME

Mikhail Epikhin in Data Engineers
Пользуетесь уже? Как оно?
источник

VE

Vladimir E. in Data Engineers
А разве юпитер/зеппелин не может считаться заменой Hue?
источник