Телеграмм чат группы hadoopusers страница 4211

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Engineers

3187 membersпожаловаться на группу

2021 September 15

T

T in Data Engineers

Короче все оказалось проще я обосрался с типами, но почему то репл нормально сжирал а вот когда дело доходило до применения udf все разваливалось

источник

13:39пожаловаться #1

N

Nikita Blagodarnyy in Data Engineers

Может репл грузит какой-нибудь имплисит, а ты нет

источник

14:02пожаловаться #2

T

T in Data Engineers

Там столько абстракций где может упасть что я не стал раскапывать, за даунгредился на 2 Спарк и зафигачил старый добрый фулл джар

источник

14:04пожаловаться #3

T

T in Data Engineers

Коллегам прийдется пострадать чуток, но не сильно

источник

14:05пожаловаться #4

AD

Alex D in Data Engineers

Коллеги, а кто ни будь может дать отзыв о вот этих курсах по Flink
https://www.ververica.com/training#schedule
Кроме того , что это курсы от организаторов конференции Flink Forward.
Или посоветовать любые другие хорошие курсы по Flink (на русском или на английском) в том числе и платные.

Flink Training | By the Original Creators of Apache Flink | Ververica

Our Apache Flink training provides a comprehensive introduction to stream processing with Apache Flink. The training is updated for each new Flink release.

источник

14:49пожаловаться #5

A

Alex in Data Engineers

Кроме того , что это курсы от основных разработчиков flink

источник

14:54пожаловаться #6

A

Alex in Data Engineers

@Alex_D73 основные разрыбы флинка раньше имели имя data artisants, позже их купил alitech и переименовал в ververica
про курсы ничего не скажу, но они до сих пор основные комитеры во флинк

условно как датабрикс для спарка и конфлюент для кафки

источник

14:56пожаловаться #7

AD

Alex D in Data Engineers

Круто, спасибо, не знал!

источник

14:57пожаловаться #8

AC

Alexander Chermenin in Data Engineers

Это ещё в заголовке страницы указано))

источник

15:22пожаловаться #9

AD

Alex D in Data Engineers

Кто же внимательно читает документацию 😊

источник

15:37пожаловаться #10

T

T in Data Engineers

Переслано от T

Checkout this Meetup with Netherlands Apache Pulsar Meetup: https://meetu.ps/e/KjzZL/rv9vK/i

Apache Pulsar Deep Dive, an end-to-end view of the data flow

Wed, Sep 15, 2021, 7:00 PM: For our first event, which is online, we are honored to have Enrico Olivelli as our guest speaker.Enrico is an Open Source enthusiast, passionate about Distributed Storage

источник

19:43пожаловаться #11

T

T in Data Engineers

Переслано от T

Скоро начнется

источник

19:43пожаловаться #12

T

T in Data Engineers

Может интересно кому

источник

19:44пожаловаться #13

ММ

Максим Митяев... in Data Engineers

Есть тут работодатели, кто в поисках jun+/mid инженеров ?

Я б в джобсы пошёл, но там сбщ затеряется среди остальных.

источник

20:04пожаловаться #14

РП

Роман Пашкевич... in Data Engineers

Ты просто заходи туда днем. Меньше флуда.

источник

20:05пожаловаться #15

AZ

Anton Zadorozhniy in Data Engineers

сколько не заглядывал, там слишком густая "атмосфера индустрии" (для меня)

источник

20:07пожаловаться #16

GP

Grigory Pomadchin in Data Engineers

в жобс, Максим

источник

20:08пожаловаться #17

РП

Роман Пашкевич... in Data Engineers

Я фордварнул твое сообщение в джобсы. Надеюсь ты не против был.

источник

20:08пожаловаться #18

GP

Grigory Pomadchin in Data Engineers

спасибо

источник

20:09пожаловаться #19

VF

Vasily Fomin in Data Engineers

Привет всем,
Кто-то работал плотно со spark на AWS EMR?

Изучаю производительность, и есть интересное наблюдение, один и тот же запрос на локальном Спарке (master(“local[*]”) и данными в NFS отрабатывает гораздо быстрее, чем Спарк с данными в S3.

При этом Athena быстрее, но все равно latency в секундах, а не ms, как пишут.

Тут есть очень много вводных, но в целом, данные небольшие(мегабайты), и если все хранить в одном файле, то получается быстрее, но всё равно не топ:

Local Spark - 4 seconds
AWS EMR - 20 seconds
AWS HDFS - 11 seconds

источник

20:18пожаловаться #20