Size: a a a

2021 October 25

CO

Chern Oleksander in Moscow Spark
аааа
источник

CO

Chern Oleksander in Moscow Spark
не, удобно канеша (((
источник

GP

Grigory Pomadchin in Moscow Spark
ну ты и так делаешь репартишен в 1
источник

GP

Grigory Pomadchin in Moscow Spark
если тебе ок хранить много кусочков можешь оставить оригинальное партицирование
прайтись по партициям и каждую превретить в жейсон
источник

GP

Grigory Pomadchin in Moscow Spark
это уже не так плохо звучит
источник

CO

Chern Oleksander in Moscow Spark
Та там 400 строк )))
источник

GP

Grigory Pomadchin in Moscow Spark
)
источник

GP

Grigory Pomadchin in Moscow Spark
большедата
источник

IK

Ivan Krovyakov in Moscow Spark
Коллеги, в следующий вторник мы организуем митап для технических специалистов с пачкой интересных докладов по инструментарию DataOps. Будет разбор таких технологий, как Hudi, Airflow, Trino, Spark over S3 и опыта их реального использования в онпреме и облаке. Тематика хоть и довольно широкая, но все доклады так или иначе вокруг использования всего этого вместе со Spark или в дополнение к нему: после нескольких прогонов могу сказать, что контент получается очень любопытным как для Ops, так и для DE.

Формат - после известных событий только онлайн-трансляция, но с живым чатом.

Присоединяйтесь 🙂

https://cloud.yandex.ru/events/460
источник

AS

Alexander Shorin in Moscow Spark
онлайн-печаль. очень жаль.
источник

IK

Ivan Krovyakov in Moscow Spark
я тоже не то, чтобы в восторге от этого, но это был единственный вариант сохранить дату с учетом количества зарегистрировавшихся и неопределенностью дальнейших ограничений
источник

AS

Alexander Shorin in Moscow Spark
Очень понимаю: мы по тем же причинам мероприятие срочно двигали.  Но не мог не выразить несогласие с форматом, где кажется нужно пообщаться с докладчиками и лучше бы в живую  - такие уж темы.
источник

А

Александр in Moscow Spark
Добрый день. Коннектор прикрутили, однако осталась проблема Керберос аутентификации/авторизации. Job создаётся, отображается в yarn, но падает с ошибкой GSS Тикета при попытке достучаться до регионсерверов. Как я понял в этом коннекторе нет функций user group information для применения внутри работы keytab и юзеров. Надо его допиливать, или есть решения?
источник

N

Nikita Blagodarnyy in Moscow Spark
мы до кербероса пока не дотопали, в планах.
источник

N

Nikita Blagodarnyy in Moscow Spark
расскажите, если решите.
источник

N

Nikita Blagodarnyy in Moscow Spark
ну полагаю надо как-то в спарке программно написать kinit
источник

N

Nikita Blagodarnyy in Moscow Spark
чтобы сканы с ним ходили
источник

IK

Ivan Krovyakov in Moscow Spark
да, сами от этого страдаем: темы действительно такие, что было бы здорово обсудить их сразу в офлайне, конечно. здесь могу предложить три варианта: Q&A секции прямо после каждого доклада, обсудить на всех в секции свободного общения после всех докладов или если нет желания/возможности обсуждать при всех - отправить вопросы напрямую мне в ТГ, чтобы потом отдельно собраться и поговорить
источник

AS

Alexander Shorin in Moscow Spark
🍺
источник

SS

Sergey Sheremeta in Moscow Spark
зачем вам мучения с унылым HBase, когда есть богоугодная ScyllaDB? с коннекторами к Spark'у, с великолепной поддержкой и огромным комьюнити
источник