Телеграмм чат группы moscowspark страница 753

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Moscow Spark

1168 membersпожаловаться на группу

2021 August 09

K

KrivdaTheTriewe in Moscow Spark

Ребят, есть такой кейс spark.read.parquet("path") , в path партиции вида ("path/location=msk/udt=20200505") , что вы каталисту подсказывает, чтобы он прунил партиции нормально для фильтра вида .filter(col("udt").isin(reportDatePart, reportDatePart1))

источник

17:39пожаловаться #1

ПФ

Паша Финкельштейн... in Moscow Spark

Вопрос неясен

источник

17:40пожаловаться #2

K

KrivdaTheTriewe in Moscow Spark

.filter(col("udt").isin(reportDatePart, reportDatePart1)) начинает фуллскан по датасету, а не прунит партиции

источник

17:42пожаловаться #3

ПФ

Паша Финкельштейн... in Moscow Spark

Какая прелесть! А если ===, а не in?

источник

17:43пожаловаться #4

N

Nikita Blagodarnyy in Moscow Spark

подсказываем читать предварительно собранный набор поркет-путей.

источник

18:01пожаловаться #5

N

Nikita Blagodarnyy in Moscow Spark

я где-то читал, что это должны были полечить в 3 спраке. но похоже не полечили.

источник

18:02пожаловаться #6

K

KrivdaTheTriewe in Moscow Spark

я с иквалзом гляну, если с иквалзом работает, то лучше юнион сделать будет

источник

18:02пожаловаться #7

ПФ

Паша Финкельштейн... in Moscow Spark

да

источник

18:02пожаловаться #8

ПФ

Паша Финкельштейн... in Moscow Spark

или может быть просто where (a or b)

источник

18:02пожаловаться #9

N

Nikita Blagodarnyy in Moscow Spark

val paths = Seq(reportDatePart,reportDatePart1).map(x => s’’path/location=msk/udt=$x’’)
spark.read.parquet(paths)

источник

18:06пожаловаться #10

K

KrivdaTheTriewe in Moscow Spark

короче

источник

18:09пожаловаться #11

K

KrivdaTheTriewe in Moscow Spark

Есть ли ребята, кто прям каталист тюнил для таких вещей?

источник

18:09пожаловаться #12

ПФ

Паша Финкельштейн... in Moscow Spark

Я фигню сказал

источник

18:10пожаловаться #13

ПФ

Паша Финкельштейн... in Moscow Spark

Конечно у тебя будет фулскан!

источник

18:10пожаловаться #14

ПФ

Паша Финкельштейн... in Moscow Spark

Даже на иквалзе

источник

18:10пожаловаться #15

ПФ

Паша Финкельштейн... in Moscow Spark

потому что тебе надо сначала фильтр по локации

источник

18:10пожаловаться #16

ПФ

Паша Финкельштейн... in Moscow Spark

и никакой тюнинг каталиста тут не поможет, только другую проекцию собрать

источник

18:11пожаловаться #17

K

KrivdaTheTriewe in Moscow Spark

вот я прям оч хочу как то спарку подсказать

источник

18:11пожаловаться #18

K

KrivdaTheTriewe in Moscow Spark

поч, птимайзер написать условный

источник

18:11пожаловаться #19

ПФ

Паша Финкельштейн... in Moscow Spark

Но веди такой udt может быть в любой локации

источник

18:11пожаловаться #20