Телеграмм чат группы ctodailychat страница 5112

так воркеры задачи из очереди не берут и все...

16:18пожаловаться #1

DK

Dmitriy K in ctodailychat

внешний провайдер не гарантирует время ответа, так что асинхронная обработка нужна

16:21пожаловаться #2

AP

это значит, что если мы хотим отправлять в API 1 запрос в секунду, а она начнет отдавать ответ каждые 5 секунд, мы все еще должны отправлять каждую 1 секунду. но респонс обрабатывать как-то асинхронно когда придет ответ.

то есть хочется динамически увеличивать кол-во исходящих запросов при увеличении latency? но так можно и завалить внешний api, необычное требование

16:23пожаловаться #3

VD

Artur

если проблема в том, что весь сервис встает из-за одного из АПИ, то логично сделать отдельную очередь / тред пул на этот или каждый сервис

оно так и сделано сейчас. но, если у нас увеличивается количество серверов - надо запускать отдельный celery worker на новую очередь.
а если время ответа растет - надо увеличивать количество тредов динамически.

и как-то вот это мне все не нравится)

16:23пожаловаться #4

VD

Alexander Panko

то есть хочется динамически увеличивать кол-во исходящих запросов при увеличении latency? но так можно и завалить внешний api, необычное требование

ну, пока непонятно) видимо придется упомянуть, что запросы идут через прокси, и это они, скорее всего, увеливают latentcy. API готово принимать запросы с определенным rate limit'ом

16:24пожаловаться #5

AP

ну, пока непонятно) видимо придется упомянуть, что запросы идут через прокси, и это они, скорее всего, увеливают latentcy. API готово принимать запросы с определенным rate limit'ом

но на вашей стороне это понять непросто, можно трекать ttfb и от него плясать высчитывая типа true rate limit и изменяя кол-во исходящих запросов, но как-то это хрупко очень можно и ту сторону завалить и себя перегрузить в случае если на той стороне проблемы

16:29пожаловаться #6

VD

ну, в идеале иметь решение, которое позволило бы снижать rate limit в случае, если удаленный сервер начал на нас ругаться

16:30пожаловаться #7

AP

ну в целом token bucket со стратегией анализа response time и изменением кол-аа токенов динамически вроде как нормальный выход

16:33пожаловаться #8

VD

Celery throttling — настраивам rate limit для очередей

Andrey

как вариант притормозить такски к такому api
https://habr.com/ru/post/494090/

Хабр

В этой статье я покажу как решить одну из проблем, возникающих при использовании распределенных очередей задач — регулирование пропускной способности очереди,...

я это посмотрел и идея вроде бы ничего.

но есть одно но. в простом случае у нас таска идет вида:
1. взяли что-то из базы
2. сделали запрос к API
3. сохранили ответ в БД

но в более сложном
1. взяли из базы
2. сделали несколько запросов к API
3. обработали данные
4. сделали еще один запрос к API
5. сохранили в БД

используя этот подход я так понимаю придется дробить задачи на много мелких, тогда на задачу-запрос к API можно повесить такой rate-limit. но создавать и управлять такими микро-задачками будет сложновато на мой взгляд.

16:39пожаловаться #9

A

я это посмотрел и идея вроде бы ничего.

но есть одно но. в простом случае у нас таска идет вида:
1. взяли что-то из базы
2. сделали запрос к API
3. сохранили ответ в БД

но в более сложном
1. взяли из базы
2. сделали несколько запросов к API
3. обработали данные
4. сделали еще один запрос к API
5. сохранили в БД

используя этот подход я так понимаю придется дробить задачи на много мелких, тогда на задачу-запрос к API можно повесить такой rate-limit. но создавать и управлять такими микро-задачками будет сложновато на мой взгляд.

Разделяй и властвуй

16:39пожаловаться #10

VD

кстати, нашел недавно вот такую штуку для создания цепочки celery задачек: https://ovh.github.io/celery-director/

но как-то это все выглядит устрашающе.

16:42пожаловаться #11

A

Имхо апилимит/количество воркеров - сделать сегодня

16:43пожаловаться #12

VD

хотя переписать все на asyncio/aiohttp будет, наверное, еще дольше)

16:43пожаловаться #13

A

А переписать на token bucket на след неделе

16:43пожаловаться #14

VD

Andrey

Имхо апилимит/количество воркеров - сделать сегодня

так оно не будет работать если у нас API/прокси стала в 2 раза медленее ответ отдавать.

в вашем примере
> ок, api может в 10 запросов в минуту, у нас 5 worker'ов, поставим им 2r/m и радуемся жизни

10 запросов в минуту - это очень хорошие условия)

что если нужно делать 10 запросов в секунду? при этом API может ответить за 1 секунду, а может за 2.
если сделаем 10 потоков с ограничением 1 задача в секунду, тогда при скорости ответа 1 секунда все будет ок. а если будет 2 секунды - мы тогда будет ждать вместо того, что сделать следующие запросы.

16:47пожаловаться #15

AP

хотя переписать все на asyncio/aiohttp будет, наверное, еще дольше)

это же не упростит архитектуру, только сэкономит ресурсов и увеличит возможно пропускную способность в сложных сценариях, это имхо nice to have в вашем случае

16:48пожаловаться #16

A

так оно не будет работать если у нас API/прокси стала в 2 раза медленее ответ отдавать.

в вашем примере
> ок, api может в 10 запросов в минуту, у нас 5 worker'ов, поставим им 2r/m и радуемся жизни

10 запросов в минуту - это очень хорошие условия)

что если нужно делать 10 запросов в секунду? при этом API может ответить за 1 секунду, а может за 2.
если сделаем 10 потоков с ограничением 1 задача в секунду, тогда при скорости ответа 1 секунда все будет ок. а если будет 2 секунды - мы тогда будет ждать вместо того, что сделать следующие запросы.

у вас синхронная обработка на celerey, так?

16:49пожаловаться #17

VD

Alexander Panko

это же не упростит архитектуру, только сэкономит ресурсов и увеличит возможно пропускную способность в сложных сценариях, это имхо nice to have в вашем случае

в смысле, хороше бы на asyncio переделать? я этом случае придется я так понимаю вообще все переделать на асинхронщину, а на это ресурсов нет( плюс там встают проблемы с асинхронной работой с БД.

поэтому я всеми силами пытаюсь остаться на селери и что-то придумать с ним. готовы даже на неоптимальное использование железа (т.е. тупо взять больше серверов)

16:50пожаловаться #18

VD

Andrey

у вас синхронная обработка на celerey, так?

да

16:50пожаловаться #19

AP

в смысле, хороше бы на asyncio переделать? я этом случае придется я так понимаю вообще все переделать на асинхронщину, а на это ресурсов нет( плюс там встают проблемы с асинхронной работой с БД.

поэтому я всеми силами пытаюсь остаться на селери и что-то придумать с ним. готовы даже на неоптимальное использование железа (т.е. тупо взять больше серверов)

в смысле что не стоит, это мало чем поможет в решении описанной проблемы а ресурсов может много съесть