Size: a a a

2021 May 11

BL

Boris Litvyakov in Scrapy
удалил и не помню деталей, делал с селениума в лоб
источник

SS

Sergey Sergey in Scrapy
А, это без скрейпи?
источник

BL

Boris Litvyakov in Scrapy
да
источник

SS

Sergey Sergey in Scrapy
Понял. Не, мне именно со скрейпи надо. Селениум стараюсь не использовать. Спасибо
источник

BL

Boris Litvyakov in Scrapy
я один раз логинился через селениум при запуске скрейпи и дальше использовал полученные кукис
источник

SS

Sergey Sergey in Scrapy
Понял
источник

NZ

Nikita Zhidkov in Scrapy
Привет, при разборе сайта в именах класса часто встречаются странные окончания, например n___tEM20 в gallery-section___tEM20  подскажите, пожалуйста, что они означают и будут ли с этим проблемы? Например меняются динамически раз в неделю, или что-то такое
источник

AR

Andrey Rahmatullin in Scrapy
означают автогенерацию классов, проблемы будут если их в селекторах прямо так и использовать (и не будут если не использовать)
источник
2021 May 12

AV

Anatoli Valenda in Scrapy
Есть вопрос. Кто чем пользуется, чтобы скрапить в связке с puppeteer?
источник

AV

Anatoli Valenda in Scrapy
Из мне знакомых вариантов: докер и pyppeteer.
источник

AV

Anatoli Valenda in Scrapy
Может есть ещё что-то?
источник

SS

Sergey Sergey in Scrapy
А разве нужно что-то еще?
источник

R

Rafil in Scrapy
Всем привет!!! Есть анти-ддос защита - variti. Есть ли способы ее обойти, кто знает?
источник

E

Evgen in Scrapy
Способы есть
источник

R

Rafil in Scrapy
например?
источник

R

Rafil in Scrapy
с помощью pyppeteer очень долго собирает
источник

E

Evgen in Scrapy
ну масштабируйте его, если долго
источник

na

n00b always in Scrapy
Если он там работает +- как лаудфлаер то искать айпишник сервера настоящий, если это анализ пакетов, то смотреть что оно и как там анализирует
источник

AA

An Allford in Scrapy
Привет всем, может кто-то может пояснить в какой момент вызывается process_spider_output() из мидлвейра? В планах из него зайилдить айтем в процессе парсинга, но не могу попасть в этот метод, не вызывается
Из доки не понятно

написал мидлвейр

class UnavailableLinksMiddleware:
   def process_response(self,request, response, spider):
       return response

   def process_spider_output(self, response, result, spider):
       for x in result:
           yield x

в
process_response заходит, в process_spider_output нихрена
источник

МС

Михаил Синегубов... in Scrapy
как мидлварь подключена?
источник