Полностью никак нельзя закрыться, чем лучше защита тем больше обычные пользователи страдают
хреновый хостинг на парсинг действует аки крест на нечисть 😂 уже отказывался от нескольких таких сайтов, когда говоришь клиенту, что скорось 1-5 страниц в минуту, так сразу нах....
хреновый хостинг на парсинг действует аки крест на нечисть 😂 уже отказывался от нескольких таких сайтов, когда говоришь клиенту, что скорось 1-5 страниц в минуту, так сразу нах....
хреновый хостинг на парсинг действует аки крест на нечисть 😂 уже отказывался от нескольких таких сайтов, когда говоришь клиенту, что скорось 1-5 страниц в минуту, так сразу нах....
Господа, приветствую. Мы в работе используем django+scrapy+celery, это монолитный сервис который содержит в себе порядка двухста скраперов, которые стало невероятно трудно поддерживать. Вопрос такой возникла идея разбить скраперы на микросервисы, как это можно сделать? Наверняка кто-то здесь имеет представление о том как это сделать, буду рад услышать предложения
Господа, приветствую. Мы в работе используем django+scrapy+celery, это монолитный сервис который содержит в себе порядка двухста скраперов, которые стало невероятно трудно поддерживать. Вопрос такой возникла идея разбить скраперы на микросервисы, как это можно сделать? Наверняка кто-то здесь имеет представление о том как это сделать, буду рад услышать предложения
Какие именно трудности с поддержкой? Celery это уже шаг от простого скрапи к микросервисам
Какие именно трудности с поддержкой? Celery это уже шаг от простого скрапи к микросервисам
Один скрапер может забить воркер, логи храняться где-то в GAE, сами данные в GCS, на поиск проблемы и ее решение уходит до двух дней, под каждый скрапер приходится писать импортер который содержит примерно один и тот же код, за исключением вкраплений постпроцессинга
>под каждый скрапер приходится писать импортер который содержит примерно один и тот же код имеет смысл нанять нормального программиста, который слышал про ооп