Коллеги, есть небольшой вопрос.
Есть сайт с примерно такой структурой:
site.rusite.ru/catalog/ - список разделов
site.ru/catalog/12345 (страница раздела)
site.ru/catalog/12345/?PAGEN_1=2 (пагинация)
site.ru/catalog/12345/12345 - товар.
Я написал спайдер, спарсил категории и понял(возможно ошибаюсь), что достучаться до товара можно и без предварительного парсинга каталога с помощью
rules = (
Rule(LinkExtractor(allow=('',)), callback='parse_page'),
)
Но не могу понять как именно.
Пример того, что написал:
https://gist.github.com/wavedocs/ee02500a61234f50055a931d7329e66e