Size: a a a

2021 May 20

AR

Andrey Rahmatullin in Scrapy
А вот описанный воркфлоу может и правда проще самому сделать
источник

(

(o_O) in Scrapy
Похоже, вам нужен scrapyd
источник

AR

Andrey Rahmatullin in Scrapy
Или да
источник

(

(o_O) in Scrapy
А процесс-менеджер нужен чтобы запускать процесс и перезапускать если он умер
источник

А

Александр in Scrapy
Спасибо. Про scrapyd читал, но не совсем понял, какую апишку юзать для периодичного запуска пауков...
источник

OS

Oleg Shleiko in Scrapy
Лично я использую процесс-менеджер supervisor (если я верно понял о чём речь)
источник

(

(o_O) in Scrapy
cron + curl .../schedule.json
источник

А

Александр in Scrapy
Я так понял, что scrapyd это сервер, в который можно делать запросы на парсинг, но вот меня интересовал момент, каким образом делать эти запросы
источник

А

Александр in Scrapy
Да, уже понял, спасибо
источник

OS

Oleg Shleiko in Scrapy
как пример
requests.post('http://0.0.0.0:6800/schedule.json', data={
               'project': 'default',
               'spider': <spider_name>
           })
источник

(

(o_O) in Scrapy
scrapyd запускает пауков (в т.ч. параллельно). В общем-то и все
источник

(

(o_O) in Scrapy
Если вам надо api типа послал урл - получил данные, смотрите scrapy-rt
источник

А

Александр in Scrapy
Разве в кроне нет лимита с минимальной периодичностью в одну минуту?
источник

OS

Oleg Shleiko in Scrapy
В кроне минута, верно
источник

(

(o_O) in Scrapy
А вы собираетесь пауков запускать чаще?
источник

A

Andrii in Scrapy
Человек наверное сам еще не знает что ему нужно
источник

А

Александр in Scrapy
Я хотел бы чтото типа послал урл и периодичность - запустился некий воркер или сервис (не силен в терминологии), который в цикле запускает парсинг с указанной периодичностью
источник

А

Александр in Scrapy
У меня уже все реализовано, но своими силами - выше указано
источник

А

Александр in Scrapy
тут
источник

OS

Oleg Shleiko in Scrapy
цикличный парсинг одного и того же урла?
источник