Size: a a a

2021 April 08

OS

Oleg Shleiko in Scrapy
купленные, но бывают битые и нет долгое время респонза
источник

A

Andrii in Scrapy
да должно по идее помочь
источник

AR

Andrey Rahmatullin in Scrapy
да думаю должен
источник

OS

Oleg Shleiko in Scrapy
спс
источник

A

Alex in Scrapy
Нет, озадачиваться сравнением производительности не надо 😁, это лишнее. Я к тому, что БС как раз и начал с какого-то момента использовать lxml на уровне настоятельных рекомендаций как раз именно из-за его скорости по сравнению со своими/стандартными решениями. Но прошло столько времени, а api xpath, как самое эффективное, из lxml так и не перекочевало. Я лично вообще за pure xpath, а все эти БС-ы... уж лучше стандартным html.parser-ом заморочиться и не тянуть лишние зависимости.
Мне как-то на stackoverflow один увлеченный товарищ с пеной у рта доказывал, какой БС замечательный и самый лучший (не сравнится с lxml), и что стоит им начать пользоваться, как потом за уши не оттянешь. 😁
источник

A

Alex in Scrapy
Объяснится просто: заказчик хочет поддерживать потом то, что знает сам
источник

A

Andrii in Scrapy
заказчик аналог хотлайн в мексике, не думаю что СЕО будет что-то поддерживать)
источник

A

Alex in Scrapy
Ну, зачем-то же подчеркнул, что не использовать. О мотивации из тех 2-х пунктов можно только догадываться
источник

NZ

Nikita Zhidkov in Scrapy
Привет, большое спасибо, то что нужно! Я так понял update_settings это не очень распространённый вариант (что-то в документации про него ничего нет, кроме его наличия в исходниках), поэтому сделал через мидлвэир в котором условие на запрос через селениум, а иначе возвращаю None и в таком случае работает дефолтный варинт скрапи (обычный request видимо).

Единственное у меня повился вопрос, а где находится мидлвеир с помощью которого скрапи в итоге отправляет запрос? Я просмотрел все встроенные мидлвеиры(точнее их метод process_request) и никто не отправляет
источник

МС

Михаил Синегубов... in Scrapy
вроде же шедулер добавляет в очередь запросы...
источник

E

Evgen in Scrapy
запрос проходит через каждый мидлварь
источник

E

Evgen in Scrapy
по очереди
источник

E

Evgen in Scrapy
и там что-то с ним случается. или не случается
источник

NZ

Nikita Zhidkov in Scrapy
Это я понял, только вот не вижу мидлвеир который отправляет запрос
источник

AR

Andrey Rahmatullin in Scrapy
мидлвари на то и мидл
источник

AR

Andrey Rahmatullin in Scrapy
ты что-то другое должен искать
источник

NZ

Nikita Zhidkov in Scrapy
а, ок, спасибо, но это уже скорее просто интерес был :)
источник

AR

Andrey Rahmatullin in Scrapy
смотри всякое в scrapy.core
источник

G

Georgiy in Scrapy
Возможно имеет смысл взглянуть на архитектуру scrapy
https://docs.scrapy.org/en/latest/topics/architecture.html
источник

S

SoHard 🎄 in Scrapy
появился интересный момент с cloudflare
источник