Size: a a a

2021 May 22

GS

Grigory Skvortsov in Data Engineers
источник
2021 May 23

IB

Islom Babaev in Data Engineers
всем привет. подкиньте книжку по спарку на питоне пожалуйста
источник

R

Ruslan in Data Engineers
У меня была в электронном виде pyspark  рецепты на английском, попозже могу скинуть
источник

AS

Andrey Smirnov in Data Engineers
источник

IB

Islom Babaev in Data Engineers
буду признателен)
источник

IB

Islom Babaev in Data Engineers
спасибо, нашел в книгах в тг))
источник
2021 May 24

РД

Роман Друзык... in Data Engineers
#need help
Язык: Python
Возможно кому-то вопрос покажется тривиальным, но я прям что-то залип и очень нуждаюсь во внешнем совете
Парсю веб морду Ярна(внутри аппдикейшена), на данном этапе получаю стрингу такой структуры:
Class(List({q:1}, {w:2}), List({a:1}, {s:2}), Int, Int)
Как вытащить второй лист джейсончиков?

Небольшой пример
drawApplicationTimeline(
[
 {
   'id': 'executors',
   'content': 2},
 {
   'id': 'jobs',
   'content': 3
 }
], [
{
'className': 'job application-timeline-object running',
 'group': 'jobs'},
{
'className': 'job application-timeline-object succes',
 'group': 'jobs'}
],
1233445,
344
)
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Открою секрет, у ярна есть апи
источник

РД

Роман Друзык... in Data Engineers
Но через это апи нельзя получить время завершения последней джобы внутри апликейшена
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Зато пром может 😬
источник

РД

Роман Друзык... in Data Engineers
Что за пром?
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Prometheus
источник

S

Sebastian in Data Engineers
Вы какой мдм используете?
источник

AM

Almaz Murzabekov in Data Engineers
Excel 😂
источник

e

er@essbase.ru in Data Engineers
Oracle DRM , 1С (самопис)
источник

PK

Pavel Kirillov in Data Engineers
Коллеги, помогите с hdfs. Имеем датаноду на 8 железных дисков и диски там разного размера: 6 по 6Тб и 2 по 16Тб (всего 68Тб). Если сделать 8 volume по числу дисков, то hdfs, используя дефолтный алгоритм размещения блоков, будет по round-robin раскладывать данные по дискам и утилизация дисков по %занятого места будет неравномерной. Можно на файловой системе нарезать дисков по 2Тб и сделать 34 volume. Это с одной стороны решит проблему с равномерным заполнением, а с другой всё же 34 директории. Вопрос: Можно ли как-то ещё добиться равномерного заполнения дисков?
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Выделить две группы
источник

PK

Pavel Kirillov in Data Engineers
группы?
источник

AZ

Anton Zadorozhniy in Data Engineers
dfs.datanode.fsdataset.volume.choosing.policy поставить в Available Space
источник

PK

Pavel Kirillov in Data Engineers
@dartov спасибо, выглядит как то что мне нужно
источник