Size: a a a

2020 March 04

М

Мак in Scrapy
Мистика... Жмёшь кнопку - урл проскочил в нетворке. Действие произошло. Стираю куки, перезагружаю страницу - сую тот же урл в браузере напрямую - действие произошло. То есть сервер запомнил состояние. Беру новую страницу, выдергиваю из разметки его подобный урл, кнопку не нажимаю - сую сразу урл в адресную строку. Результата нет. Жму кнопку - в нетворке вижу что прошёл точно такой же гет запрос, который я совал напрямую в адрес до этого - результат есть...
источник

AS

Alexander Serebrov in Scrapy
кроме кук есть же еще local storage, может там что-то сохраняется
источник

М

Мак in Scrapy
Не, у меня браузер который под дев тулс заточен под полную очистку всех своих состояний после перезагрузки
источник

i

ildar in Scrapy
А если IP  сменить?
источник

М

Мак in Scrapy
ildar
А если IP  сменить?
Первое что попробовал
источник

B

Bulatbulat48 in Scrapy
Мак
Мистика... Жмёшь кнопку - урл проскочил в нетворке. Действие произошло. Стираю куки, перезагружаю страницу - сую тот же урл в браузере напрямую - действие произошло. То есть сервер запомнил состояние. Беру новую страницу, выдергиваю из разметки его подобный урл, кнопку не нажимаю - сую сразу урл в адресную строку. Результата нет. Жму кнопку - в нетворке вижу что прошёл точно такой же гет запрос, который я совал напрямую в адрес до этого - результат есть...
источник

М

Мак in Scrapy
Не https везде
источник

М

Мак in Scrapy
Каких то диковинных запросов небыло
источник

AR

Andrey Rahmatullin in Scrapy
GET же
источник

М

Мак in Scrapy
Всякий мусор типа яндекс метрики или гугл аналитики же не может влиять я надеюсь
источник

i

ildar in Scrapy
Помнится я с подобным сталкивался на сайте  upwork,он сразу вычислял как-то, что это селениум и начинал показывать бесконечные капчи. В итоге я бросил это дело, т.к. это был просто эксперимент из любопытства да и у них есть API
источник

М

Мак in Scrapy
Кстати, а какого то решения нет ещё насчёт того, что делать с несколькими потоками скрапи, когда в один из них прилетает капча? Пока она решается - все потоки собирают так же себе по капче. И в итоге вместо одной, решать приходится десяток
источник

i

ildar in Scrapy
Andrey Rahmatullin
жаловаться надо было в октябре, сейчас я уже не помню что мы тогда обсуждали
А, да, я просто неправильно похоже прочел ветку про это на гитхабе. Ну плач Ярославны был в октябре, в этом чатике, а надо было походу на гитхабе плакать.
источник

i

ildar in Scrapy
ildar
о, 1.8.0 вышел, надо глянуть пачноутсы)
да, как раз я в октябре глянул на patch notes
источник

i

ildar in Scrapy
ildar
чооооо, вот паразиты!
The LevelDB storage backend (scrapy.extensions.httpcache.LeveldbCacheStorage) of HttpCacheMiddleware is deprecated (issue 4085, issue 4092)
и расплакался ^_^
источник

i

ildar in Scrapy
Мак
Кстати, а какого то решения нет ещё насчёт того, что делать с несколькими потоками скрапи, когда в один из них прилетает капча? Пока она решается - все потоки собирают так же себе по капче. И в итоге вместо одной, решать приходится десяток
а кукисы разные для разных потоков? А то смотрю вот http://doc.scrapy.org/en/latest/topics/downloader-middleware.html#std:reqmeta-cookiejar
источник

i

ildar in Scrapy
так там еще вроде как заморочиться надо с cookiejar чтобы даже разные пауки использовали разные кукисы
источник

i

ildar in Scrapy
еще чуть дальше про meta['dont_merge_cookies'] описано. Хм, может быть происходит так, что когда оно мержит разные куки, то они могут неправильно смержиться? К примеру из той штуки, где капча еще не решена. Или это вообще не про это механизм а для "нижестоящих фукнций" и последующих вызовов.
источник

К

Кирилл in Scrapy
Нормально оно мерджит, это просто обновление кукисов от респонса
источник

i

ildar in Scrapy
а оно не влияет на соседние треды?
источник