Size: a a a

2021 March 06

GP

Grigory Pomadchin in Data Engineers
KrivdaTheTriewe
Окей , компьют то где то есть ?
какой комптют?
источник

GP

Grigory Pomadchin in Data Engineers
многие просто так хдфс поднимают как помойку файлов юзают
источник

GP

Grigory Pomadchin in Data Engineers
что вообще есть компют то
источник

GP

Grigory Pomadchin in Data Engineers
не понимаю менеджер ресурсов или что?
источник

K

KrivdaTheTriewe in Data Engineers
Grigory Pomadchin
многие просто так хдфс поднимают как помойку файлов юзают
В Амазоне ?
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
Окей , компьют то где то есть ?
AWS Batch, Fargate
источник

GP

Grigory Pomadchin in Data Engineers
KrivdaTheTriewe
В Амазоне ?
ну да дешевле типа
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
AWS Batch, Fargate
Ну можно их взять окей
источник

K

KrivdaTheTriewe in Data Engineers
Grigory Pomadchin
ну да дешевле типа
Чем с3 ?
источник

GP

Grigory Pomadchin in Data Engineers
да вообще можно спрото иметь хдфс растянутую и чем угодно в нее ходить
источник

GP

Grigory Pomadchin in Data Engineers
KrivdaTheTriewe
Чем с3 ?
для интенсивных ридов райтов - да
источник

GP

Grigory Pomadchin in Data Engineers
в разы
источник

GP

Grigory Pomadchin in Data Engineers
s3 чаржит за манипуляции ж
источник

A

Alex in Data Engineers
Grigory Pomadchin
ты в прод так пускаешь?
Я пускал :) правда не спарк а флинк, потому что "машинки застряли на границе, код написан, надо процессить"

На локал машине с local[*] пришлось запускать, так как стендалон кластер подымать с секурити задолбался бы

Как-то работало, но больше такого опыта не хочу
источник

K

KrivdaTheTriewe in Data Engineers
Ок ,можно Амазон батч
источник

GP

Grigory Pomadchin in Data Engineers
да можно просто машинку поднять отдельную которая будет шарить сетку и ходить в хдфс
источник

K

KrivdaTheTriewe in Data Engineers
Я к тому что Спарк можно запустить ста способами , какой нибудь вам подойдёт
источник

GP

Grigory Pomadchin in Data Engineers
по контексту вопроса не ясно вообще что нужен спарк
источник

GP

Grigory Pomadchin in Data Engineers
мож там просто фс распределенная исторически хдфс
источник

K

KrivdaTheTriewe in Data Engineers
Grigory Pomadchin
по контексту вопроса не ясно вообще что нужен спарк
Я порккомелрвпл как один из способов
источник