Size: a a a

2020 November 16

AR

Andrey Rahmatullin in Scrapy
SoHard 🎄
да там странно сайт работает, с 0,5 сек - запросов 100 проходит, а потом 500. Хотя не банит и если опять паука запустить можно дальше парсить
ичо? ставить делей
источник

AR

Andrey Rahmatullin in Scrapy
ты ж хотел делей
источник

S

SoHard 🎄 in Scrapy
хочу чтобы задержка плавала в зависимости от того летят ли ошибки
источник

A

Andrii in Scrapy
SoHard 🎄
да там странно сайт работает, с 0,5 сек - запросов 100 проходит, а потом 500. Хотя не банит и если опять паука запустить можно дальше парсить
Может в куки записует, пробуй без куки или кукиджар
источник

S

SoHard 🎄 in Scrapy
спс, сейчас гляну
источник

S

SoHard 🎄 in Scrapy
источник

S

SoHard 🎄 in Scrapy
               "Server said {response.status} (Please Slow Down)."
               " Too stupid to slow down, so stopping instead.")
источник
2020 November 17

SS

Stepan Smirnov in Scrapy
https://apps.sfc.hk/edistributionWeb/api/news/content?refNo=9PR84B&lang=EN
Нужно сохранить значение "html" который содержится в подобных ответах в отдельный файл.
Какой метод для этого переписать в FilesPipeline? Подменить buf в file_downloaded()?
источник

МС

Михаил Синегубов... in Scrapy
а при чем тут файловый пайп? не проще переписать экспортер?
источник

SS

Stepan Smirnov in Scrapy
К сожалению, на остальных пауках используется pipeline, а их в проекте уже под сотню
источник

SS

Stepan Smirnov in Scrapy
плюс есть еще обычные html и pdf файлы, которые сохраняются из того же паука.
источник

МС

Михаил Синегубов... in Scrapy
вообще, сохранение в файл сидит в MediaPipeline.file_downloaded
источник

МС

Михаил Синегубов... in Scrapy
а тебе пааа жопе, это в сырцах за 3 мин находится :)
источник

ЕJ

Евгений Jen in Scrapy
Всем привет, всем добра 🤟🌴😎
кто работал с getcourse.ru  - как  скачать видео mp2p ?
(пробовал stream-video-downloader.com SaveFrom.net helper - не помогло)
есть возможность качать отдельный огрызок видео длинной 3секунды (если руками перейти по ссылке из вкладки network - скрин)
источник

B

Bulatbulat48 in Scrapy
Евгений Jen
Всем привет, всем добра 🤟🌴😎
кто работал с getcourse.ru  - как  скачать видео mp2p ?
(пробовал stream-video-downloader.com SaveFrom.net helper - не помогло)
есть возможность качать отдельный огрызок видео длинной 3секунды (если руками перейти по ссылке из вкладки network - скрин)
на одном стриминговом сервисе получалось найти первую запись и последную и соеденив их в запросе (уже не помню как) - получить полную запись. Возможно тут тоже самое. Например ..ch/первая запись/вторая запись(ее поменять)/…
источник
2020 November 18

СТ

Семён Трояновский... in Scrapy
всем привет! подскажите плз, если кому-то приходилось краулить сайты написанные с webassembly: какие есть варианты рабочие? у меня чот ни селениум ни пупитр не взлетают
источник

AR

Andrey Rahmatullin in Scrapy
прикольно, ни разу не слышал о такой проблеме (или о таких сайтах, чоуж)
источник

СТ

Семён Трояновский... in Scrapy
источник

AR

Andrey Rahmatullin in Scrapy
поиск там обычным XHR, никакого селениума поди не надо
источник

AR

Andrey Rahmatullin in Scrapy
правда капча может быть
источник