Телеграмм чат группы scrapy

Коллеги, есть небольшой вопрос.
Есть сайт с примерно такой структурой:

site.ru
site.ru/catalog/ - список разделов
site.ru/catalog/12345 (страница раздела)
site.ru/catalog/12345/?PAGEN_1=2 (пагинация)
site.ru/catalog/12345/12345 - товар.

Я написал спайдер, спарсил категории и понял(возможно ошибаюсь), что достучаться до товара можно и без предварительного парсинга каталога с помощью
rules = (
Rule(LinkExtractor(allow=('',)), callback='parse_page'),
)
Но не могу понять как именно.

Пример того, что написал:
https://gist.github.com/wavedocs/ee02500a61234f50055a931d7329e66e

источник

14:50пожаловаться #14

B

Bulatbulat48 in Scrapy

Nazar

Коллеги, есть небольшой вопрос.
Есть сайт с примерно такой структурой:

site.ru
site.ru/catalog/ - список разделов
site.ru/catalog/12345 (страница раздела)
site.ru/catalog/12345/?PAGEN_1=2 (пагинация)
site.ru/catalog/12345/12345 - товар.

Я написал спайдер, спарсил категории и понял(возможно ошибаюсь), что достучаться до товара можно и без предварительного парсинга каталога с помощью
rules = (
Rule(LinkExtractor(allow=('',)), callback='parse_page'),
)
Но не могу понять как именно.

Пример того, что написал:
https://gist.github.com/wavedocs/ee02500a61234f50055a931d7329e66e

Это crawlspider, по allow - разрешает парсить, у тебя вроде все можно

источник

14:56пожаловаться #15

B

Bulatbulat48 in Scrapy

И callback в функцию отправляет

источник

14:56пожаловаться #16

N

Nazar in Scrapy

Bulatbulat48

Это crawlspider, по allow - разрешает парсить, у тебя вроде все можно