Телеграмм чат группы hadoopusers страница 3217

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Engineers

2308 membersпожаловаться на группу

2021 February 05

UD

Uncel Duk in Data Engineers

Это же вообще доступно, насколько помню в платной раньше был jfr бекпортнут, но сейчас он и в опенждк уже есть (не помню точно номер, 242 вроде, летом вышла)

Ну про г1 пока не спешат

источник

14:19пожаловаться #1

UD

Uncel Duk in Data Engineers

Может конеш чо изменится

источник

14:19пожаловаться #2

AZ

Anton Zadorozhniy in Data Engineers

Nikita Blagodarnyy

репартишоном. сколько партишонов-столько и файлов. но надо понимать, что это довольно дорогая операция.

Ещё coalesce, без сортировки

источник

14:28пожаловаться #3

ИК

Иван Калининский... in Data Engineers

Anton Zadorozhniy

Ещё coalesce, без сортировки

В конкретном кейсе, если я правильно понял, надо увеличивать количество партишенов-файлов. Coalesce не поможет

источник

14:30пожаловаться #4

N

Nikita Blagodarnyy in Data Engineers

Anton Zadorozhniy

Ещё coalesce, без сортировки

когда много данных-будет медленнее.

источник

14:30пожаловаться #5

AZ

Anton Zadorozhniy in Data Engineers

Иван Калининский

В конкретном кейсе, если я правильно понял, надо увеличивать количество партишенов-файлов. Coalesce не поможет

Да, это только уменьшать число файлов (что нужно чаще)

источник

14:31пожаловаться #6

ИК

Иван Калининский... in Data Engineers

Nikita Blagodarnyy

когда много данных-будет медленнее.

медленнее - потому что будет меньше тасков и каждый из них будет выполняться дольше. И неравномерно к тому же. Сам стейдж coalesce как правило намного быстрее repartition

источник

14:33пожаловаться #7

AK

Anton Kulaga in Data Engineers

"при записи спарком в партиционированную папку?"
Имеется в виду .partitionBy при записи? Или каждая партиция отдельно пишется?

источник

14:38пожаловаться #8

RY

Ruslan515 Y in Data Engineers

Переслано от Ruslan515 Y

image_2021-02-05_19-33-05.png

Всем добрый вечер. Пытаюь к Postgre подлючится через ssh. Нашел такой пример. ssh тунель создается нормально, но к post не могу подлючится. Кто может подсказать, что не так делаю?

источник

17:38пожаловаться #9

NT

Nikita Tikhomirov in Data Engineers

Переслано от Ruslan515 Y

image_2021-02-05_19-33-05.png

Всем добрый вечер. Пытаюь к Postgre подлючится через ssh. Нашел такой пример. ssh тунель создается нормально, но к post не могу подлючится. Кто может подсказать, что не так делаю?

там нужен localhost, а не ip адрес бд (в params)

источник

18:06пожаловаться #10

NT

Nikita Tikhomirov in Data Engineers

Так как тунель создается на localhost

источник

18:06пожаловаться #11

RY

Ruslan515 Y in Data Engineers

Nikita Tikhomirov

там нужен localhost, а не ip адрес бд (в params)

Получается там просто пишем "localhost"?

источник

18:07пожаловаться #12

NT

Nikita Tikhomirov in Data Engineers

+

источник

18:07пожаловаться #13

RY

Ruslan515 Y in Data Engineers

Nikita Tikhomirov

+

Ща проверим 😀

источник

18:07пожаловаться #14

NT

Nikita Tikhomirov in Data Engineers

Ща проверим 😀

Скажешь, если работает)

источник

18:08пожаловаться #15

K

KrivdaTheTriewe in Data Engineers

Добрый день. Может был у кого-то опыт написания перекладчика с kafka в hadoop (hdfs)? Интересуют показатели (скорость чтения, скорость записи).

Spark easy datalake

источник

18:21пожаловаться #16

K

KrivdaTheTriewe in Data Engineers

Добрый день. Может был у кого-то опыт написания перекладчика с kafka в hadoop (hdfs)? Интересуют показатели (скорость чтения, скорость записи).

https://github.com/ReiReiRei/spark_easy_datalake

ReiReiRei/spark_easy_datalake

Contribute to ReiReiRei/spark_easy_datalake development by creating an account on GitHub.

источник

18:21пожаловаться #17

K

KrivdaTheTriewe in Data Engineers

Там можно в сто раз лучше решить все конечно же

источник

18:22пожаловаться #18

P

Pavel in Data Engineers

Переслано от Ruslan515 Y

image_2021-02-05_19-33-05.png

Всем добрый вечер. Пытаюь к Postgre подлючится через ssh. Нашел такой пример. ssh тунель создается нормально, но к post не могу подлючится. Кто может подсказать, что не так делаю?

Надо разрешить подключение всконфиг файле с желаемых хостов, либо со всех

источник

19:01пожаловаться #19

NG

Nikita Gunbin in Data Engineers

Привет! Пробую настроить spark-submit на удаленный кластер с помощью Big Data Tools в InteliJ. Все отлично работает. Хочу добавть в before lauch сборку через sbt package. В итоге отрабатывает только сборка и все. (перекидывание джарника и spark-submit не стартует). Есть идеи?

источник

19:13пожаловаться #20