Телеграмм чат группы moscowspark страница 151

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Moscow Spark

872 membersпожаловаться на группу

2019 August 01

PK

Pavel Klemenkov in Moscow Spark

День добрый! А подскажите - бывает ли трансляция Moscow Spark?

Будет и трансляция и запись

источник

14:49пожаловаться #1

R

Ren in Moscow Spark

А ссылку на трансляцию как можно получить? После реги? Или рега только для очного?

источник

14:51пожаловаться #2

PK

Pavel Klemenkov in Moscow Spark

А ссылку на трансляцию как можно получить? После реги? Или рега только для очного?

Ссылка будет в этом чате за 10-15 минут до начала

источник

14:51пожаловаться #3

R

Ren in Moscow Spark

Pavel Klemenkov

Ссылка будет в этом чате за 10-15 минут до начала

источник

14:52пожаловаться #4

R

Ren in Moscow Spark

Спасибо!

источник

14:52пожаловаться #5

K

KrivdaTheTriewe in Moscow Spark

Pavel Klemenkov

Ссылка будет в этом чате за 10-15 минут до начала

ура

источник

15:12пожаловаться #6

K

KrivdaTheTriewe in Moscow Spark

приду

источник

15:12пожаловаться #7

K

KrivdaTheTriewe in Moscow Spark

интересно, Пётор придет?

источник

15:12пожаловаться #8

PK

Pavel Klemenkov in Moscow Spark

Какой из?

источник

15:14пожаловаться #9

K

KrivdaTheTriewe in Moscow Spark

@tenKe вы выбрали что то для стриминга и датаквалити по нему?

источник

16:27пожаловаться #10

t

tenKe in Moscow Spark

KrivdaTheTriewe

@tenKe вы выбрали что то для стриминга и датаквалити по нему?

первую часть вопроса не совсем понял, по второй обходимся тем же етл над стримами

источник

16:31пожаловаться #11

K

KrivdaTheTriewe in Moscow Spark

ну условно, вы как-то проверяете в микробатче значения какие-то или потом батчем уже качество данных смотрите?

источник

16:56пожаловаться #12

t

tenKe in Moscow Spark

KrivdaTheTriewe

ну условно, вы как-то проверяете в микробатче значения какие-то или потом батчем уже качество данных смотрите?

на стриме

источник

18:42пожаловаться #13

K

KrivdaTheTriewe in Moscow Spark

на стриме

Вы какой - то фреймворк используете или сами условия кодом расписали?

источник

19:30пожаловаться #14

t

tenKe in Moscow Spark

все руками, никакой электроники)

источник

19:34пожаловаться #15

2019 August 02

ab

a b in Moscow Spark

Всем привет, подскажите по поведению спарка, есть логи в паркете (около 2 Tb), ищу в них регуляркой определенный паттерн, хочу записать csv с 100 строками из логов, удовлетворяющему условию.

val df = spark.read.parquet("/path/to/parquet/*").filter("_raw rlike 'GET'").limit(100)
val res = df.collect() 
df.write.csv("/path/to/csv")

Почему collect отдает результаты почти сразу же, а write.csv запускает фильтр видимо по всем данным, а только потом выполняет limit?

источник

11:55пожаловаться #16

DG

Denis Gabaydulin in Moscow Spark

Привет.
Кто нибудь сталкивался с проблемой (см. также тикеты внутри) в spark 2.4.x + zeppelin 0.8.1:
https://issues.apache.org/jira/browse/SPARK-20525

Или может хотя бы объяснить в чем проблема, на пальцах?

источник

14:31пожаловаться #17

2019 August 06

SO

Simon Osipov in Moscow Spark

@pklemenkov ^ spam

источник

06:49пожаловаться #18

PK

Pavel Klemenkov in Moscow Spark

Хм, бодренько мы закрыли регистрацию в этот раз ))

источник

14:47пожаловаться #19

С

Сюткин in Moscow Spark

Pavel Klemenkov

Хм, бодренько мы закрыли регистрацию в этот раз ))

Секрет в офисе

источник

19:25пожаловаться #20