Size: a a a

2021 March 06

K

KrivdaTheTriewe in Data Engineers
Спросили же как
источник

K

KrivdaTheTriewe in Data Engineers
Кинул свое полелие
источник

A

Alex in Data Engineers
KrivdaTheTriewe
Я к тому что Спарк можно запустить ста способами , какой нибудь вам подойдёт
Перекладывать файлы можно обычным куском кода, хоть java с spring kafka
источник

GP

Grigory Pomadchin in Data Engineers
^
источник

GP

Grigory Pomadchin in Data Engineers
есть вырождается случай в local[*] то спарк нинад.
источник

AZ

Anton Zadorozhniy in Data Engineers
В докуберные времена мрачного онпрема это был нормальный вариант для приземления в HDFS, так работал Camus, но для облачной инфраструктуры Спарк это большой оверхед для логистики данных
источник

UR

Uncle Ruckus in Data Engineers
Alex
Перекладывать файлы можно обычным куском кода, хоть java с spring kafka
источник

K

KrivdaTheTriewe in Data Engineers
Alex
Перекладывать файлы можно обычным куском кода, хоть java с spring kafka
Менеджмента партиций не будет :)
источник

K

KrivdaTheTriewe in Data Engineers
Ну то есть Спарк программа либо падает , либо читает весь топик , а со спрингом вы весело будете читать из одной партиции, а из другой нет , так как приложение упало
источник

AZ

Anton Zadorozhniy in Data Engineers
Ну и вообще там же приземлятор в S3 пилят в MSK, скоро это будет просто конфиг для Кафки
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
В докуберные времена мрачного онпрема это был нормальный вариант для приземления в HDFS, так работал Camus, но для облачной инфраструктуры Спарк это большой оверхед для логистики данных
Ну вот тут люди хдфс в Амазоне подымают без ярна, вдруг оно дешевле будет Амазон батча?
источник

GP

Grigory Pomadchin in Data Engineers
KrivdaTheTriewe
Ну вот тут люди хдфс в Амазоне подымают без ярна, вдруг оно дешевле будет Амазон батча?
да прост уж выкинуть хдфс писать в с3 батчами
источник

K

KrivdaTheTriewe in Data Engineers
Grigory Pomadchin
да прост уж выкинуть хдфс писать в с3 батчами
Ну так можно , допускаю
источник

GP

Grigory Pomadchin in Data Engineers
что знач допускаешь))) большинство амазона так работает ж
источник

K

KrivdaTheTriewe in Data Engineers
Grigory Pomadchin
что знач допускаешь))) большинство амазона так работает ж
Смотри как пост изначально выглядит
источник

K

KrivdaTheTriewe in Data Engineers
Переслано от Pavel
Коллеги, а кто как пишет из кафки на, например, S3 или (вдруг до сих пор!) на hdfs?
Флюм и кафку коннект не предлагать🙂
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
Ну вот тут люди хдфс в Амазоне подымают без ярна, вдруг оно дешевле будет Амазон батча?
Это могут делать ради производительности, и то в узких случаях, дешевле никак быть не может, мы же с вами видим цены на EBS
источник

K

KrivdaTheTriewe in Data Engineers
Тут ни слова про Амазон, есть только слово с3 которым может хоть минио оказаться
источник

K

KrivdaTheTriewe in Data Engineers
Коршуны :(
источник

GP

Grigory Pomadchin in Data Engineers
KrivdaTheTriewe
Тут ни слова про Амазон, есть только слово с3 которым может хоть минио оказаться
И ни слова про ярн
источник