Телеграмм чат группы hadoopusers страница 3665

Size: a a a

Data Engineers

2021 May 21

Я не знаю как там реализовано внутри, но скорее всего вы правы и dbsubnet, ec2subnet и ElastiCache subnet должны быть идентичны.

источник

09:46пожаловаться #1

Anton Zadorozhniy in Data Engineers

я не знаю о каких dbsubnet вы говорите, в AWS есть EC2 Subnet, для запуска RDS и ElastiCache их надо группировать в специфичные группы, я думал вы про группы спрашиваете

источник

09:49пожаловаться #2

Andrey Smirnov in Data Engineers

известно когда планируют спарк на 3 scala переписать?
вообще интересный вопрос, гиганты типа твиттера вряд ли будут переезжать на 3, это же сколько работы понадобится, не добьет ли третья скала вообще всю скалу.

источник

14:47пожаловаться #3

Anton Zadorozhniy in Data Engineers

В твиттере война скалистов с гошниками, и скалисты проигрывают

источник

15:15пожаловаться #4

Max Efremov in Data Engineers

Спарк на го?

источник

15:17пожаловаться #5

Max Efremov in Data Engineers

Spark Go. Звучит как продолжение покемонов)

источник

15:18пожаловаться #6

Mikhail Epikhin in Data Engineers

зачем? есть же dask

источник

15:18пожаловаться #7

Renarde in Data Engineers

будет spark на rust + arrow - check here https://github.com/apache/arrow-datafusion

GitHub

apache/arrow-datafusion

Apache Arrow DataFusion and Ballista query engines - apache/arrow-datafusion

источник

15:19пожаловаться #8

KrivdaTheTriewe in Data Engineers

я думаю он скопилится почти без изменений

источник

15:30пожаловаться #9

Pavel Klemenkov in Data Engineers

Так даск на питоше

источник

15:30пожаловаться #10

KrivdaTheTriewe in Data Engineers

неприятное api

источник

15:32пожаловаться #11

Grigory Pomadchin in Data Engineers

А это кстати прикольно, не знаю как работает ток

источник

15:36пожаловаться #12

Ruslan Krivoshein in Data Engineers

А в pyspark можно как-то значение колонок датафреймов сделать типа set, чтобы потом разницу множеств найти простым вычитанием? Не могу самостоятельно найти такого способа

источник

15:45пожаловаться #13

Andrey Smirnov in Data Engineers

ruby -> scala -> go?
ну если первое привело к уменьшению серверов больше чем на порядок, то второе переписывание кто оплатит, уже такого эффекта не будет

источник

15:49пожаловаться #14

АЖ

Андрей Жуков... in Data Engineers

ну станет скала легаси, что поделать

источник

15:52пожаловаться #15

Andrey Smirnov in Data Engineers

let df = df.filter(col("a").lt_eq(col("b")))?
.aggregate(vec![col("a")], vec![min(col("b"))])?
.limit(100)?;

бррр

источник

15:52пожаловаться #16

Grigory Pomadchin in Data Engineers