Телеграмм чат группы scrapy

Коллеги, есть небольшой вопрос.
Есть сайт с примерно такой структурой:

site.ru
site.ru/catalog/ - список разделов
site.ru/catalog/12345 (страница раздела)
site.ru/catalog/12345/?PAGEN_1=2 (пагинация)
site.ru/catalog/12345/12345 - товар.

Я написал спайдер, спарсил категории и понял(возможно ошибаюсь), что достучаться до товара можно и без предварительного парсинга каталога с помощью
rules = (
Rule(LinkExtractor(allow=('',)), callback='parse_page'),
)
Но не могу понять как именно.

Пример того, что написал:
https://gist.github.com/wavedocs/ee02500a61234f50055a931d7329e66e

в стандартный парс передавать категории и отдельный для итемов, можно по хпазу выбирать

источник

15:32пожаловаться #8

Elisei Badanin in Scrapy

Bulatbulat48

она более вернего уровня?

что-то вроде селениума по уровню(но без жс)

источник

15:32пожаловаться #9

Bulatbulat48 in Scrapy

#job #работа #python #вакансия #удаленно

Требуется Python Developer УДАЛЕННО!

✅Требования:
• Опыт в разработке от 3-х лет с использованием Python и Django
• Хорошее знание технологий парсинга сайтов - Scrapy, Splash, Headless Chrome
• Хорошие коммуникативные навыки
• Успешный опыт работы на проектах с распределенной командой

✅Условия:
• Основная задача – разработка и поддержка парсера сайтов по недвижимости
• Удаленная работа с почасовой оплатой, примерно 10-20 часов в неделю
• Оплата до 1200 руб/час

✉️ Если вас заинтересовала вакансия пришлите пожалуйста резюме на olga.pankina@hotger.com

источник

15:36пожаловаться #10

Nazar in Scrapy

Elisei Badanin

в стандартный парс передавать категории и отдельный для итемов, можно по хпазу выбирать

это легче\сложнее?

источник

15:46пожаловаться #11

Nazar in Scrapy

категории я уже спарсил, просто не знаю как дальше заставить скрапи работать

источник

15:47пожаловаться #12

Elisei Badanin in Scrapy

гибче/легче

источник

15:47пожаловаться #13

Elisei Badanin in Scrapy

ну по икспазу или паттерну выбирать страницы с айтимами и их на другой кэллбэк

источник

15:47пожаловаться #14

Nazar in Scrapy

Вот я тут получаю категории

def parse(self, response):
        root = Selector(response)

        links = root.css('li > a::attr(href)')

        for link in links:
            link_item = VodopadCatalogItem()
            link_item['link'] = link.extract()
            yield link_item

источник

15:48пожаловаться #15

Nazar in Scrapy

как теперь отправить его на другой коллбек?!

источник

15:48пожаловаться #16

Bulatbulat48 in Scrapy

yield scrapy.Request(url, callback=self.parse_httpbin)

источник

15:48пожаловаться #17

Cyberdine Engineering🐤 in Scrapy

Надо запустить какую нибудь рекламку этого канала