Size: a a a

2020 October 26

МС

Михаил Синегубов... in Scrapy
    start_urls = ['https://pikabu.ru/tag']

   def parse(self, response, **kwargs):
       yield response.follow('https://pikabu.ru/tag', dont_filter=True)


первый запрос проходит, второй - бан.
проксю включал/выключал, пауза 20 секунд
источник

iz

iz zi in Scrapy
Реф/хэдер?
источник

AR

Andrey Rahmatullin in Scrapy
Реферер на себя вроде всегда безопасно
источник

S

SoHard 🎄 in Scrapy
Михаил Синегубов
    start_urls = ['https://pikabu.ru/tag']

   def parse(self, response, **kwargs):
       yield response.follow('https://pikabu.ru/tag', dont_filter=True)


первый запрос проходит, второй - бан.
проксю включал/выключал, пауза 20 секунд
а там апи так и не завезли?
источник

iz

iz zi in Scrapy
SoHard 🎄
а там апи так и не завезли?
У них же есть приложения , скорей всего есть
источник

МС

Михаил Синегубов... in Scrapy
SoHard 🎄
а там апи так и не завезли?
издеваешься? они приложуху, относительно недавно запилили :)
источник

S

SoHard 🎄 in Scrapy
Михаил Синегубов
издеваешься? они приложуху, относительно недавно запилили :)
уже пару лет как есть приложуха
источник

МС

Михаил Синегубов... in Scrapy
мы не ищем легких путей 😂
приложуху - это я дома ковырну
источник

AR

Andrey Rahmatullin in Scrapy
(была презентаха как из приложения запросы вытащить, но она внутренняя 😝)
источник

МС

Михаил Синегубов... in Scrapy
через чарлик/фиддлер?
источник

AR

Andrey Rahmatullin in Scrapy
Не скажу, но да
источник

iz

iz zi in Scrapy
Andrey Rahmatullin
(была презентаха как из приложения запросы вытащить, но она внутренняя 😝)
Вот это у вас новые технологии
источник

AR

Andrey Rahmatullin in Scrapy
Дак ну
источник

AR

Andrey Rahmatullin in Scrapy
источник

МС

Михаил Синегубов... in Scrapy
Andrey Rahmatullin
Не скажу, но да
ну, если только SSLPining (или как он там правильно) не влезет, то вообще не проблема 😄
источник

i

i in Scrapy
Михаил Синегубов
юзерагент - выпадает, я ротатор поставил....
20 секундная пауза - не катит :).
хех, аж интересно, блин.
а может опять тема как у авито? типа поиграться с TLS'ом)
источник

МС

Михаил Синегубов... in Scrapy
неть, это первым было

в общем, у них, похоже, довольно хитрый бан. Он ставится на каталог (теги, пагинацию).
Если через сайтмап парсить - конечные страницы, вроде, не баняться. По крайней мере, пока))
источник

А

Альбо in Scrapy
Кто может спарсить телеграм Каналы ?
источник

К

Кирилл in Scrapy
Альбо
Кто может спарсить телеграм Каналы ?
С заказами в @scrapy_jobs
источник

A

Andrii in Scrapy
Альбо
Кто может спарсить телеграм Каналы ?
Дуров
источник