Size: a a a

2021 May 13

AR

Andrey Rahmatullin in Scrapy
если на улице не идёт дождь, но идёт снег, то условие верно
источник

AR

Andrey Rahmatullin in Scrapy
то есть тут не даже не с булевой логикой проблемы, а и с бытовой
источник

S

SoHard 🎄 in Scrapy
источник

na

n00b always in Scrapy
Ясно, спасибо.
источник

NZ

Nikita Zhidkov in Scrapy
Привет, а что посоветуете почитать на тему как избежать бана? Заголовки наверное надо как-то правильно проставлять и тд. А то меня тут после первого же запроса за сайтмапом через scrapy забанили 😐
источник

МС

Михаил Синегубов... in Scrapy
защиты у каждого сайта свои.
так что, от такого бана никто не застрахован
источник

МС

Михаил Синегубов... in Scrapy
прям "почитать" не знаю, одно могу посоветовать, подделывай браузер...
источник

NZ

Nikita Zhidkov in Scrapy
Буду смотреть, спасибо
источник

NZ

Nikita Zhidkov in Scrapy
Что-то уже сверх странное, я с браузера ручками зашел на сайт в sitemap.xml и после этого меня забанило. Ранее этот сайт я не пытался парсить. Появляется такая вот ошибка
источник

AR

Andrey Rahmatullin in Scrapy
а на главную?
источник

NZ

Nikita Zhidkov in Scrapy
Есть идеи, ребят? А то выглядит так что проблема на моей стороне
источник

AR

Andrey Rahmatullin in Scrapy
вобщем-то у меня даже вгет качает этот файл
источник

NZ

Nikita Zhidkov in Scrapy
В общем это сайт https://www.timberland.com/ если захожу на главную то кинет на .ru и там всё работает, а если куда-то внутрь https://www.timberland.com/shop/mens-shoes то ошибка выше
источник

NZ

Nikita Zhidkov in Scrapy
причём до того как я попытался зайти на https://www.timberland.com/sitemap.xml всё работало, а после нет
источник

A

Andrii in Scrapy
Поклади прокси и парсь себе
источник

AR

Andrey Rahmatullin in Scrapy
куки почисти
источник

NZ

Nikita Zhidkov in Scrapy
пробовал, не помогает
источник

A

Andrii in Scrapy
Еще вопрос откуда вообще тьі взял Timberland.com/sitemap.xml
источник

NZ

Nikita Zhidkov in Scrapy
из robots.txt
источник

A

Andrii in Scrapy
Если там https://www.timberland.com/.sitemap.xml
источник