Size: a a a

2020 October 29

МС

Михаил Синегубов... in Scrapy
iframe src=....
не на какие мысли не наводит?
источник

МС

Михаил Синегубов... in Scrapy
это же совершенно другой документ. И ты его видишь только в браузере. Если надо из скрапи - то получай отдельно
источник

V

Victor in Scrapy
Михаил Синегубов
это же совершенно другой документ. И ты его видишь только в браузере. Если надо из скрапи - то получай отдельно
Пробовал достучаться через xpath, не находил элементы скрытые в этом блоке
источник

МС

Михаил Синегубов... in Scrapy
чем страницу получешь?
источник

V

Victor in Scrapy
Я не хочу что бы эту задачу за меня решили, хочу понять что прочитать, что бы разобраться, дошел уже к Selenium через jQuery
источник

МС

Михаил Синегубов... in Scrapy
ну, вообще вопрос "чем страницу получешь?" и был что бы помочь разобраться. Нахрен за тебя что то делать* 😂
Если реквесты, то надо отдельно фрейм получать
источник

V

Victor in Scrapy
Как я понял, нужно сначала frame вызвать, тогда откроется следующая вложенность, и я смогу кликнуть по кнопке
источник

V

Victor in Scrapy
В теории, правильно понял?
источник

V

Victor in Scrapy
источник

К

Кирилл in Scrapy
Один из вариантов
источник

SS

Stepan Smirnov in Scrapy
https://pa.newham.gov.uk/online-applications/
Пытаюсь отправить с одним ключевым словом и различными временными промежутками, но почему-то парсится только один промежуток из множества.
например, нужно отправить запрос за 2018 и 2019 года (каждый я января по декабрь), но записывается только 2018 год, а 2019 фильтруется - запрос с ним (наверное) неверно генерируется. Но не понятно как это исправить.

'dupefilter/filtered' должен быть окуло нуля, а
'item_scraped_count': примерно в три раза больше

Что я делаю не так?

https://pastebin.com/rM19Qakw
источник
2020 October 30

AR

Andrey Rahmatullin in Scrapy
ну так посмотри какие ты запросы отправляешь, от этого и плясать
источник

МС

Михаил Синегубов... in Scrapy
Stepan Smirnov
https://pa.newham.gov.uk/online-applications/
Пытаюсь отправить с одним ключевым словом и различными временными промежутками, но почему-то парсится только один промежуток из множества.
например, нужно отправить запрос за 2018 и 2019 года (каждый я января по декабрь), но записывается только 2018 год, а 2019 фильтруется - запрос с ним (наверное) неверно генерируется. Но не понятно как это исправить.

'dupefilter/filtered' должен быть окуло нуля, а
'item_scraped_count': примерно в три раза больше

Что я делаю не так?

https://pastebin.com/rM19Qakw
строка 31, а зачем слать кучу GET запросов на одну  страницу?
источник

SS

Stepan Smirnov in Scrapy
Михаил Синегубов
строка 31, а зачем слать кучу GET запросов на одну  страницу?
пытался сессии создать
источник

SS

Stepan Smirnov in Scrapy
Stepan Smirnov
https://pa.newham.gov.uk/online-applications/
Пытаюсь отправить с одним ключевым словом и различными временными промежутками, но почему-то парсится только один промежуток из множества.
например, нужно отправить запрос за 2018 и 2019 года (каждый я января по декабрь), но записывается только 2018 год, а 2019 фильтруется - запрос с ним (наверное) неверно генерируется. Но не понятно как это исправить.

'dupefilter/filtered' должен быть окуло нуля, а
'item_scraped_count': примерно в три раза больше

Что я делаю не так?

https://pastebin.com/rM19Qakw
пофиксили, помог cookiejar
источник

SS

Stepan Smirnov in Scrapy
Можно ли ускорить работу Scrapy с кэшем на уровне кода? Если да, то в какую сторну смотреть?
источник

AR

Andrey Rahmatullin in Scrapy
?
источник

МС

Михаил Синегубов... in Scrapy
Stepan Smirnov
Можно ли ускорить работу Scrapy с кэшем на уровне кода? Если да, то в какую сторну смотреть?
если я правильно понял, то:
первый шаг - написать свой мидлварь (или кто там за это отвечает) и использованием более быстрого хранилища
второй шаг - нафиг переписать скрапи, и, скорее всего, с использованием совершенно другого языка. Может даже с использованием компилируемого....
источник

МС

Михаил Синегубов... in Scrapy
а, забыл нулевой шаг - поискать не стандартную либу для работы с кэшем
источник

МС

Михаил Синегубов... in Scrapy
и кстати, сколько у тебя данных, что он у тебя тормозит
источник