Size: a a a

2021 September 15

T

T in Data Engineers
Короче все оказалось проще я обосрался с типами, но почему то репл нормально сжирал а вот когда дело доходило до применения udf все разваливалось
источник

N

Nikita Blagodarnyy in Data Engineers
Может репл грузит какой-нибудь имплисит, а ты нет
источник

T

T in Data Engineers
Там столько абстракций где может упасть что я не стал раскапывать, за даунгредился на 2 Спарк и зафигачил старый добрый фулл джар
источник

T

T in Data Engineers
Коллегам прийдется пострадать чуток, но не сильно
источник

AD

Alex D in Data Engineers
Коллеги, а кто ни будь может дать отзыв о вот этих курсах по Flink
https://www.ververica.com/training#schedule
Кроме того , что это курсы от организаторов конференции Flink Forward.
Или посоветовать любые другие хорошие курсы по Flink (на русском или на английском) в том числе и платные.
источник

A

Alex in Data Engineers
Кроме того , что это курсы от основных разработчиков flink
источник

A

Alex in Data Engineers
@Alex_D73 основные разрыбы флинка раньше имели имя data artisants, позже их купил alitech и переименовал в ververica
про курсы ничего не скажу, но они до сих пор основные комитеры во флинк

условно как датабрикс для спарка и конфлюент для кафки
источник

AD

Alex D in Data Engineers
Круто, спасибо, не знал!
источник

AC

Alexander Chermenin in Data Engineers
Это ещё в заголовке страницы указано))
источник

AD

Alex D in Data Engineers
Кто же внимательно читает документацию 😊
источник

T

T in Data Engineers
Переслано от T
Checkout this Meetup with Netherlands Apache Pulsar Meetup: https://meetu.ps/e/KjzZL/rv9vK/i
источник

T

T in Data Engineers
Переслано от T
Скоро начнется
источник

T

T in Data Engineers
Может интересно кому
источник

ММ

Максим Митяев... in Data Engineers
Есть тут работодатели, кто в поисках jun+/mid инженеров ?

Я б в джобсы пошёл, но там сбщ затеряется среди остальных.
источник

РП

Роман Пашкевич... in Data Engineers
Ты просто заходи туда днем. Меньше флуда.
источник

AZ

Anton Zadorozhniy in Data Engineers
сколько не заглядывал, там слишком густая "атмосфера индустрии" (для меня)
источник

GP

Grigory Pomadchin in Data Engineers
в жобс, Максим
источник

РП

Роман Пашкевич... in Data Engineers
Я фордварнул твое сообщение в джобсы. Надеюсь ты не против был.
источник

GP

Grigory Pomadchin in Data Engineers
спасибо
источник

VF

Vasily Fomin in Data Engineers
Привет всем,
Кто-то работал плотно со spark на AWS EMR?

Изучаю производительность, и есть интересное наблюдение, один и тот же запрос на локальном Спарке (master(“local[*]”) и данными в NFS отрабатывает гораздо быстрее, чем Спарк с данными в S3.

При этом Athena быстрее, но все равно latency в секундах, а не ms, как пишут.

Тут есть очень много вводных, но в целом, данные небольшие(мегабайты), и если все хранить в одном файле, то получается быстрее, но всё равно не топ:

Local Spark - 4 seconds
AWS EMR - 20 seconds
AWS HDFS - 11 seconds
источник