Size: a a a

2020 April 24

МС

Михаил Синегубов in Scrapy
из опыта - 90% времени занимают запросы, так что скрапи со своим одним потоком живет и зравствует.
но если требуется прям п...ц какой тюнинг и дорога каждая миллисекунда, то тогда вообще с питона надо уходить :)
источник

М

Мак in Scrapy
вот это дал гари...)))
источник

AK

Anil Kumar in Scrapy
How to scrape a website if I click on the link on that website  the url won't change. But the data is getting in html format only not json in backend.
источник

AR

Andrey Rahmatullin in Scrapy
create a Selector with that HTML data and query it
источник

Q

Qwelcer in Scrapy
Михаил Синегубов
когда каждый камушек в процессоре занят своим процессом, гуглится по слову "многопоток".
скрапи однопоточный, у него только запросы асинхроннные
синхронные запросы - отправил запрос, дождался ответа, отправил след. запрос
асинхронные запросы - отправил разом 100500 мульёнов запросов, и по мере поступления ответов, обрабатываешь
многопоток  - у тебя 100500 потоков шлют одновременно 100500 запросов (синхрн или асинхрон - это кто насколько извратится) и так же одновременно обрабатывается
То есть многопроцессорность и многопоточность это одно понятие? Я думал обратное, спасибо пошел гуглить)
источник

AK

Anil Kumar in Scrapy
Andrey Rahmatullin
create a Selector with that HTML data and query it
But the page is loading using Javascript after 3 - 8 sec of original page loading.
источник

AR

Andrey Rahmatullin in Scrapy
so?
источник

AK

Anil Kumar in Scrapy
How to wait until page loads.
источник

AR

Andrey Rahmatullin in Scrapy
Scrapy doesn't execute JS.
источник

AR

Andrey Rahmatullin in Scrapy
neither does it "load the page"
источник

AR

Andrey Rahmatullin in Scrapy
just do the same request as the page does, your initial question suggests you know how to do that
источник

AK

Anil Kumar in Scrapy
Andrey Rahmatullin
neither does it "load the page"
So should I use splash?
источник

AR

Andrey Rahmatullin in Scrapy
источник

AK

Anil Kumar in Scrapy
Thank you.
источник

К

Кирилл in Scrapy
Qwelcer
То есть многопроцессорность и многопоточность это одно понятие? Я думал обратное, спасибо пошел гуглить)
Ты под "многопроцессорность" подразумеваешь процессоры или процессы?
источник

G

Genadyi in Scrapy
Кирилл
Ты под "многопроцессорность" подразумеваешь процессоры или процессы?
Скорее всего 2
источник

G

Genadyi in Scrapy
Qwelcer
То есть многопроцессорность и многопоточность это одно понятие? Я думал обратное, спасибо пошел гуглить)
Поток и процесс отличаются
источник

Q

Qwelcer in Scrapy
Кирилл
Ты под "многопроцессорность" подразумеваешь процессоры или процессы?
Да, я про процессы
источник

AR

Andrey Rahmatullin in Scrapy
пишешь продюсер-консумер пауков и поехали
источник

AR

Andrey Rahmatullin in Scrapy
так делают когда слишком дохера итемов, либо когда они дособирываются регулярно как-то, либо когда хочется распараллелить консумеров (потому что монолитный спайдер ты так просто не распараллелишь)
источник