Size: a a a

2021 March 31

K

Kayota in Scrapy
я пробовал
источник

K

Kayota in Scrapy
Andrey Rahmatullin
первый урл
чуть меньше, чем на сайте, но близко
источник

K

Kayota in Scrapy
разница между одним урлом и семью - всего лишь около 300-400 единиц
источник

K

Kayota in Scrapy
он явно что-то не добирает
источник

AR

Andrey Rahmatullin in Scrapy
отлично, значит она есть
источник

K

Kayota in Scrapy
получается, все работает?
источник

AR

Andrey Rahmatullin in Scrapy
ну чо, включай DUPEFILTER_DEBUG и логируй вручную с какой страницы что собралось
источник

AR

Andrey Rahmatullin in Scrapy
я сразу сказал
источник

K

Kayota in Scrapy
Andrey Rahmatullin
ну чо, включай DUPEFILTER_DEBUG и логируй вручную с какой страницы что собралось
попробую, спасибо
источник

A

Alex in Scrapy
Всех приветствую!
Народ, есть здесь кто парсил или пытался парсить zzap ru?
источник

МС

Михаил Синегубов... in Scrapy
а в чем вопрос?
источник

A

Alex in Scrapy
Вопрос в обходе проверки на бездушного робота при первом посещении. Селениумом не прокатило, включая замену UA. Хотел узнать особенность обхода проверки.
источник

A

Alex in Scrapy
Простыми запросами любого типа с подстановкой всех деталей отправляемых данных, заголовков, кукисов сервер просто отдает статус 503. Т.е. должен отработать JS.
источник

AR

Andrey Rahmatullin in Scrapy
мне без защиты отдало
источник

A

Alex in Scrapy
Andrey Rahmatullin
мне без защиты отдало
Открыв в браузере?
источник

AR

Andrey Rahmatullin in Scrapy
зачем в браузере-то
источник

AR

Andrey Rahmatullin in Scrapy
LWP и скрапи
источник

A

Alex in Scrapy
Andrey Rahmatullin
LWP и скрапи
Хм.. а у меня постоянно такая прелесть. В селениуме эта страница циклично перезагружается каждые 3-5 сек. В обычном браузере отрабатывает дальше нормально. Но в процессе работы с сайтом и при переходе по ссылкам время от времени все равно выскакивает
источник

AR

Andrey Rahmatullin in Scrapy
ну понятно дело что если ты работаешь с сайтом как робот, то оно будет тебе капчу выдавать
источник

AR

Andrey Rahmatullin in Scrapy
просто ты написал "при первом посещении"
источник