Size: a a a

2021 April 17

SK

Sergei Korolev in Data Engineers
как можно ее побороть?


upd: поборол
Оставлю решение, вдруг кто будет в поиске:
https://stackoverflow.com/questions/39486351/work-with-jupyter-on-windows-and-apache-toree-kernel-for-spark-compatibility

нужно переписать скрипт с sh на cmd
источник
2021 April 18

KS

K S in Data Engineers
Пытаюсь записать датафрейм из glue в elasticache redis, но почему-то не видит класс Redis Partition.
источник

KS

K S in Data Engineers
источник

KS

K S in Data Engineers
источник

KS

K S in Data Engineers
источник

KS

K S in Data Engineers
Хотя в проекте и самом jar он есть
источник

KS

K S in Data Engineers
Вот отсюда вызывается
источник

KS

K S in Data Engineers
источник

Igor  Master in Data Engineers
Прочитал статейку вот https://martinfowler.com/articles/data-mesh-principles.html
Есть кто, кто что-то подобное делает? Как оно?
источник
2021 April 19

YC

Yan Chizhevskiy in Data Engineers
Всем привет! Можно ли постить вакансии в группе или запрещено правилами чата?
источник

M

Mino in Data Engineers
источник

M

Mino in Data Engineers
В описании того чата есть ещё один чат где только вакансии
источник

YC

Yan Chizhevskiy in Data Engineers
Спасибо!
источник

EB

Ekaterina Belova in Data Engineers
Не совсем по теме, но может посоветуете что. У меня есть junior без профильного образования. Встал вопрос с OOP. Можете посоветовать из личного опыта какую-то книгу где бы хорошо раскрывалась концепция и дальше на усложнение шло. Я нашла какие-то варианты в интернете, но фиг знает что там в них :) https://computingforgeeks.com/best-books-to-learn-object-oriented-programming/ а все пролистывать самой времени нет. junior англо-говорящий.
источник

Igor  Master in Data Engineers
Читал Head First когда то давно давно, но там было про джаву. У них хороший стиль изложения, как раз для новичков
источник

ПФ

Паша Финкельштейн... in Data Engineers
источник

ПФ

Паша Финкельштейн... in Data Engineers
Вот это офигительный проект!
источник

Igor  Master in Data Engineers
Кто может по Saprk Streaming'у помочь, никак не могу найти ответ есть код
типа
df.filter($"game_id" === gameId)
   .select($"server_ts".alias("server_ts_tmp"),
                ... ,
               from_json($"event", tableSchema) as "event")

Streaming query падает при диссериализации. Следующая джоба проезжает нормально. Значит ли это что батч который упал и был вычитан из кафки - утерян?
источник

GP

Grigory Pomadchin in Data Engineers
А покажи как падает
источник

Igor  Master in Data Engineers
 with exception: java.lang.RuntimeException: Error while decoding: org.codehaus.janino.InternalCompilerException: failed to compile: org.codehaus.janino.InternalCompilerException: Compiling "GeneratedClass": null
newInstance(class com.databricks.sql.transaction.tahoe.Snapshot$State)
источник