Телеграмм чат группы scrapy

Добрый вечер! Вопрос может слегка странный, но, есть ли здесь люди кто пробовал написать, аналог portia, только с более мощным функционалом, например как у dexi.io или может кто знает есть ли репозиторий где можно глянуть такое?

источник

21:47пожаловаться #6

Nazar in Scrapy

Misha Smirnov

судя по демке, крутой сервис

источник

21:50пожаловаться #7

Misha Smirnov in Scrapy

Nazar

судя по демке, крутой сервис

Да аналогов много, интересуют какие-то наработки или хоть что-то, как это сделано у умельцев, глядев на код portia примерно идея понятна, но может есть ещё что-то)

источник

21:52пожаловаться #8

Bulatbulat48 in Scrapy

@ebadanin не знаешь что-то похожее?

источник

22:02пожаловаться #9

2018 June 21

Elisei Badanin in Scrapy

ну это все для комерческого использования пишется, кто будет выкладывать?

источник

00:25пожаловаться #10

Elisei Badanin in Scrapy

ну у скрапинг хаба есть либа, которой скармливается несколько стираниц и она вытаскивает данные

источник

00:25пожаловаться #11

Elisei Badanin in Scrapy

типа несколько товаров засунули на выходе она находит шаблоны и отдает только данные(цена/название)

источник

00:25пожаловаться #12

Bulatbulat48 in Scrapy

Misha принимай ответ)))

источник

00:27пожаловаться #13

Danil Denysenko in Scrapy

Кстати да. Скрапихаб это что?)

источник

07:32пожаловаться #14

Danil Denysenko in Scrapy

Разве это не создатели "скрапи"?

источник

07:32пожаловаться #15

ID:507308625 in Scrapy

Всем привет.

Я не понимаю, как работает CrawlSpider, Rule и LinkExtractor в Скрапи.

Посмотрим, на примере интернет магазина.
Это просто первый сайт, который нашел в поисковике, можете объяснить на любом другом, суть не важна.

Главная ссылка - https://www.abercrombie.com/shop/wd/mens
Идем в категорию - https://www.abercrombie.com/shop/wd/mens-new-arrivals
И здесь еще есть подкатегории - https://www.abercrombie.com/shop/wd/mens-tops-new-arrivals -
наконец-то одежда наша.

rules = ( 
Rule(LinkExtractor( 
restrict_xpaths='//div[@class="grid-nav__items-list"]//@href')), 
Rule(LinkExtractor( 
restrict_xpaths='//*[@class="product-grid__col--major"]//@href' 
), callback='parse'), 
)

Если я правильно понимаю документацию(но мне кажется, что нет, так как не работает ничего =))
restrict_xpaths показывает нам урлы с главной страницы, затем идет по этим категориям, икспас нам ссылки на урлы на категории дает и к подкатегориям, я правильно понимаю, что это правило икспас, в общем скрапи будет идти в глубь и в глубь, пока может, а затем вернется второй restrict_xpaths, где есть и колбэк и отдаст нам данные функция парс.

Правильно? Или нет? В общем надеюсь на вашу помощь.
Всем спасибо.

Abercrombie & Fitch

Mens New Arrivals | Abercrombie.com

Check out Men s New Arrivals to see the latest new styles and shop this season's items that just got released.