Size: a a a

2021 April 06

AR

Andrey Rahmatullin in Scrapy
ртд не обновили ещё
источник

МС

Михаил Синегубов... in Scrapy
а, в коммите нашел, читаю :)
источник

AR

Andrey Rahmatullin in Scrapy
источник

МС

Михаил Синегубов... in Scrapy
New :class:`~scrapy.signals.headers_received` signal that allows stopping   downloads early

это то, что я подумал? можно просто по заголовкам шариться?
источник

AR

Andrey Rahmatullin in Scrapy
источник

AR

Andrey Rahmatullin in Scrapy
ну то есть я не знаю что ты имеешь в виду, но можно скачать заголовки и всё
источник

МС

Михаил Синегубов... in Scrapy
угу, я про это и говорил. Кто то тут спрашивал про это
источник

AR

Andrey Rahmatullin in Scrapy
источник
2021 April 07

OS

Oleg Shleiko in Scrapy
Всем привет. У меня  паук, который через start_requests брал N урлов из очереди и парсил данные. Это всё в асинхроне (идём на первый урл, далее на второй, далее на N, если есть вторая страница идём на неё на первом урле, на втором....). Сейчас нужно парсить 1 товар в сессии, открываю паука на 1 урл и закрываю после пропаршивания. Всё стало медленней в 4-5 раз. Вопрос: есть возможность запускать парсинг второго урла только после обработки Item от парсинга первого, что б не закрывать паука?
источник

К

Кирилл in Scrapy
Можно сделать несколько сессий или использовать https://docs.scrapy.org/en/latest/topics/signals.html#spider-idle
источник

OS

Oleg Shleiko in Scrapy
а несколько сессий как делать? тестил для каждого scrapy.Request из start_requests свой набор кук - перезаписывается. т.е. после запска второго урла новые куки используются и для первого
источник

К

Кирилл in Scrapy
источник

OS

Oleg Shleiko in Scrapy
Огромное спасибо, ушёл разбираться 👍😁
источник

S

S in Scrapy
Всем доброго дня, извиняюсь возможно оффтоп, я новичек в теме, вобщем столкнулся с такой проблемой, паршу сайт с кнопкой показать номер, посмотрел кнопка жмется по get запросу типа https://sice.com/ajax/num/{куча символов типа 4aYhdt....} Вобщем для каждой карточки генерируется разный набор этих символов, и вопрос откуда это вообще берется, как это генерируется подскажите не пойму от куда отталкиваться
источник

К

Кирилл in Scrapy
Или оно уже где-то есть на странице, или генерируется через js, соответсвенно ищи в html или js
источник

S

S in Scrapy
Понял благодарю
источник

МС

Михаил Синегубов... in Scrapy
человеки, есть информация, гуглоплей обижается на парсинг? надо просто бегать и контакты собирать?
источник

AA

An Allford in Scrapy
ты у нас спрашиваешь надо ли тебе контакты собирать?
источник

МС

Михаил Синегубов... in Scrapy
я спрашиваю банит ли гугл за парсинг :)
источник

МС

Михаил Синегубов... in Scrapy
кстати, под закон же, вроде, личные контактные данные попадают.... 🧐
источник