Size: a a a

2021 October 09

GP

Grigory Pomadchin in Data Engineers
эх где мои 3-4тб в бд
источник

ЕГ

Евгений Глотов... in Data Engineers
Смоллдата?)
источник

GP

Grigory Pomadchin in Data Engineers
источник

GP

Grigory Pomadchin in Data Engineers
ни бд ни даты
источник

ЕГ

Евгений Глотов... in Data Engineers
Можно всё и в один апп загнать
источник

DZ

Dmitry Zuev in Data Engineers
Я чо здесь выебываюсь, я этот путь прошел. И утверждаю, так делать не надо. Если нужно лить  в хдфс из бд, не берите Спарк, напишите простейшую прогу которая через буферы будет писать
источник

DZ

Dmitry Zuev in Data Engineers
Чтобы он с треском и вонью падал
источник

ЕГ

Евгений Глотов... in Data Engineers
У меня не падает, может я чёт не то делаю?)
источник

DZ

Dmitry Zuev in Data Engineers
Да, у тебя нет сложных кейсов и мало данных
источник

ЕГ

Евгений Глотов... in Data Engineers
25тб из терадаты перегонял в хайв
источник

ЕГ

Евгений Глотов... in Data Engineers
Достаточный кейс?
источник

DZ

Dmitry Zuev in Data Engineers
Один раз?
источник

DZ

Dmitry Zuev in Data Engineers
Дело в стабильности и оптимальности использования ресурсов
источник

ЕГ

Евгений Глотов... in Data Engineers
Это одна таблица, там и другие были, они просто меньше
источник

GP

Grigory Pomadchin in Data Engineers
ну можно еще свой адапетр к спаркам и придумать как конерктно твои штуки лить
но это не отличается от простейшей проги ….
источник

DZ

Dmitry Zuev in Data Engineers
Мы этим путем в итоге и пошли, если найду то пришлю код
источник

ЕГ

Евгений Глотов... in Data Engineers
Можно на жавке написать более оптимально конечно
источник

DZ

Dmitry Zuev in Data Engineers
Кароч свой скуп написали
источник

DZ

Dmitry Zuev in Data Engineers
Назвали спуп: Спарк скуп
источник

GP

Grigory Pomadchin in Data Engineers
все так; када знаешь форматы ожидания и тп то можно равномерно размазывать и прцоессить и спарк тут рил мускул будет
источник