Size: a a a

2019 June 03

MK

Max Kovgan in gcp_ru
может вам все это в кубере будет удобно гонять.
источник

MK

Max Kovgan in gcp_ru
если обработка идет по семантике map-reduce, можно через dataproc на spark.
источник

MK

Max Kovgan in gcp_ru
nnnik
по данным - каждый из этапов работает с файлом, имя которого и передается в парамметрах при его вызове
файл json может быть 100-200Мб - он читается, вычисляется и в него сохраняется (если кратко)
у вас js чем занимается?
источник

MK

Max Kovgan in gcp_ru
визуализацией/презентацией или реально обработкой?
источник

MK

Max Kovgan in gcp_ru
в общем, right tool for the job.
источник

n

nnnik in gcp_ru
Max Kovgan
визуализацией/презентацией или реально обработкой?
никакой визуализации нет, на всех этапах только чтение файла, обработка и запись в него
источник

n

nnnik in gcp_ru
Zon Orti
Если пайплайн тригерится загрузкой файла - можно сразу на бакет подписаться по пабсабу
Вы второй человек, упоминающий клауд-функции
Плз, где можно посм. пример пайп-лайна из кл.-функций и/или АппЭнджин и вызов след. этапа в пайплайне?
источник

n

nnnik in gcp_ru
Max Kovgan
может вам все это в кубере будет удобно гонять.
как раз от кубера и хотелось бы отказаться, чтобы не держать поднятые ноды, а сделать это все на цепочке вызываемых функций или аппэнджинов
источник

n

nnnik in gcp_ru
Max Kovgan
чтобы быстрее работать над бизнес логикой. и не блокироваться из-за инфра усилий - видимость, синхронизация, контроль, анализ логов. контроль доступа.
с видимостью, имхо, не должно быть траблов, т.к. все от одного юзера
источник

ZO

Zon Orti in gcp_ru
nnnik
Вы второй человек, упоминающий клауд-функции
Плз, где можно посм. пример пайп-лайна из кл.-функций и/или АппЭнджин и вызов след. этапа в пайплайне?
Так идёт обработка сообщения: https://cloud.google.com/functions/docs/calling/pubsub
А так посылать сообщения: https://cloud.google.com/pubsub/docs/publisher
источник

MK

Max Kovgan in gcp_ru
nnnik
как раз от кубера и хотелось бы отказаться, чтобы не держать поднятые ноды, а сделать это все на цепочке вызываемых функций или аппэнджинов
из-за одноразовости и редкости выполнений?
источник

MK

Max Kovgan in gcp_ru
Zon Orti
Может сразу в Cloud Functions? и передавать через pubsub вызовы.
если выполнения короткосрочные, 100% хороший подход.
источник

MK

Max Kovgan in gcp_ru
nnnik
с видимостью, имхо, не должно быть траблов, т.к. все от одного юзера
я не знаю что вы собираетесь грызть, но видимость в распределенных системах - один из инструментов разработки и отладки.
источник

ZO

Zon Orti in gcp_ru
Max Kovgan
если выполнения короткосрочные, 100% хороший подход.
Да, длительность я не учёл, нужно в 9 минут максимум уложиться
источник

MK

Max Kovgan in gcp_ru
и есть еще вопрос если есть коммуникация между этапами
источник

ZO

Zon Orti in gcp_ru
Max Kovgan
и есть еще вопрос если есть коммуникация между этапами
которая не передается через файлы или pubsub?
источник

MK

Max Kovgan in gcp_ru
напр. если у него data based api.
источник

MK

Max Kovgan in gcp_ru
т.е. он пишет в тот же файл как и читает (как намекнул выше), можно словить интересные заморочки синхронизации.
источник

ZO

Zon Orti in gcp_ru
Max Kovgan
т.е. он пишет в тот же файл как и читает (как намекнул выше), можно словить интересные заморочки синхронизации.
Это в общем так себе паттерн, словить можно много
источник

MK

Max Kovgan in gcp_ru
да. но чел написал о таком намерении... или я не понял.
источник