Size: a a a

2021 January 09

KS

K S in Data Engineers
Хотя один хост наверное может захлебнуться от такого траффика.
источник

re

reeww eew in Data Engineers
ВАЖНО📍Добрый вечер подскажите направление!!!

Изучаю python плотно уже 7 месяцев! Знаю такие библиотеки как: urllib, BeautifulSoup, Scrapy. Немного  pyTelegramBotAPI (написал пару ботов для бк)

Куда двигаться дальше??? С таким стеком на работу не устроишься, фриланс попробывал не мое! Есть два направления Data engineer vs Django. Что бы посоветовали?
источник

S

Stanislav in Data Engineers
Старый Хрыч
ну вот мне нужно сделать презентацию, почему переезд с 1 hive на 3,1,5 сильно уменьшит кол-во костылей, ускорит работу, упростит написание кода
Ты сильно рискуешь, очень. Если у вас уже есть 25 петабайт, на которых работает хайв1 (а он работает только на мр движке), то перенос кодовой базы на тройку может быть весьма болезненным. По скорости скорее всего будет плюс минус. И не дай бог влезть в хдп сборку третьехайва
источник

СХ

Старый Хрыч... in Data Engineers
Stanislav
Ты сильно рискуешь, очень. Если у вас уже есть 25 петабайт, на которых работает хайв1 (а он работает только на мр движке), то перенос кодовой базы на тройку может быть весьма болезненным. По скорости скорее всего будет плюс минус. И не дай бог влезть в хдп сборку третьехайва
почему по скорости минус будет?
источник

S

Stanislav in Data Engineers
Данных много. Тюнить тез заебешься
источник

S

Stanislav in Data Engineers
Ещё и стрельнет неоьимальныц конфиг, то оом будут на больших кусках, то джобы с пустой на 9/10 памятью
источник

A

Alex in Data Engineers
Stanislav
Ты сильно рискуешь, очень. Если у вас уже есть 25 петабайт, на которых работает хайв1 (а он работает только на мр движке), то перенос кодовой базы на тройку может быть весьма болезненным. По скорости скорее всего будет плюс минус. И не дай бог влезть в хдп сборку третьехайва
Там они протокол hive патчили, поэтому или сборка спарка от хортона, или если хочешь свой спарк, то заменяй хортон хайв на апачевский
источник

СХ

Старый Хрыч... in Data Engineers
Alex
Там они протокол hive патчили, поэтому или сборка спарка от хортона, или если хочешь свой спарк, то заменяй хортон хайв на апачевский
ну хортона больше нет
источник

СХ

Старый Хрыч... in Data Engineers
потому в любом случае уже думаем куда, аренадату даже форсят кто-то
источник

СХ

Старый Хрыч... in Data Engineers
😐просто выборки огромные, модели весят по 40-90 тб
источник

S

Stanislav in Data Engineers
При таких обьемах почему не держать ванилу - непонятно. Вроде штатка должна позволить, чай не петабайт лежит
источник

СХ

Старый Хрыч... in Data Engineers
Stanislav
При таких обьемах почему не держать ванилу - непонятно. Вроде штатка должна позволить, чай не петабайт лежит
😐25 петабайт данных, плюс расширять штат не хотят, плюс ставили хрен пойми когда, плюс нужна морда
источник

СХ

Старый Хрыч... in Data Engineers
всё таки основной плюс хортона был, что часть работы за счёт амбари можно было на техпо переложить
источник

СХ

Старый Хрыч... in Data Engineers
а с ванилью уже так не сделаешь
источник

S

Stanislav in Data Engineers
Достаточно попасть на переписывание всей кодовой базы на платформе из-за решения вендора что-то впилить или выпилить - сразу голова чистится. А связка клаудера/хортон таким обожает заниматься
источник

S

Stanislav in Data Engineers
Старый Хрыч
всё таки основной плюс хортона был, что часть работы за счёт амбари можно было на техпо переложить
Это какой работы то? Ввод новых нод?)
источник

СХ

Старый Хрыч... in Data Engineers
Stanislav
Это какой работы то? Ввод новых нод?)
😐перезапуск ярна из гуя🤣 и таймлайн сервера
источник
2021 January 10

ME

Max Efremov in Data Engineers
нужен бот от спамеров)
источник

ME

Max Efremov in Data Engineers
чо нить по бигдате спрашивать, покемон или бигдата, например)
источник

В

Вячеслав in Data Engineers
Max Efremov
чо нить по бигдате спрашивать, покемон или бигдата, например)
Например, "Что надо пропатчить под FreeBSD, если это канал об аниме?"
источник