Size: a a a

2021 April 06

S

SoHard 🎄 in Scrapy
как мне правильно прошерстить весь сайт и собрать нужный мне селектор по всех страницах сайта?
источник

S

SoHard 🎄 in Scrapy
чот такая задача никогда не попадалась, елдить все ссылки рекурсивно?
источник

NZ

Nikita Zhidkov in Scrapy
слушай, я понял как надо, спасибо :) В общем мне же надо просто сделать связь между страницей что я справил и каким-то айдишником, буду просто в одном столбце хранить урл с которого спарсил, а все действия буду делать по айдишнику (UID какой-нибудь сгенерю)
источник

МС

Михаил Синегубов... in Scrapy
еще раз и, желательно, по русски
источник

AR

Andrey Rahmatullin in Scrapy
конечно\
источник

i

i in Scrapy
зачем добавлять новые сущности (=артикул события), если ты его можешь определить по 2-3 составляющим?  Что это даст? Я все еще не понимаю логику этих действий. Если пользователю это не нужно по-факту.
источник

S

SoHard 🎄 in Scrapy
пройтись по всем страницам сайта
источник

AR

Andrey Rahmatullin in Scrapy
yield from response.follow_all(css='a') хехе
источник

AR

Andrey Rahmatullin in Scrapy
никогда так не делал
источник

МС

Михаил Синегубов... in Scrapy
эээ, ну так пройди по ним....
источник

NZ

Nikita Zhidkov in Scrapy
rules = (
       Rule(LinkExtractor(allow=r'.*'), callback='parse_item', follow=True),
   )
источник

AR

Andrey Rahmatullin in Scrapy
ну или так
источник

МС

Михаил Синегубов... in Scrapy
тока, вроде, можно
Rule(LinkExtractor(), callback='parse_item', follow=True),
источник

AR

Andrey Rahmatullin in Scrapy
ну да, allow и так пустой
источник

i

i in Scrapy
учти тока, есть некоторые сайты, по всем страницам которого ты не сможешь пройти, даже если ограничен доменом, даже если ограничен глубиной прохода 8, к примеру. Например, сайты американских универов. Даже если дашь какой-то линк "в глубине", потому-что для парсера не очевидно, где у сайта "низ"
источник

NZ

Nikita Zhidkov in Scrapy
Если это сообщение мне, то единственное что есть уникальное на странице это url, всё остальное может поменяться
источник

i

i in Scrapy
поверь мне, эта тварь выкопает ход на верхний уровень, и оттуда пойдет бесконечно копать вниз на пол-интернета)
источник

S

SoHard 🎄 in Scrapy
так а как если домен только нужный будет копать?
источник

i

i in Scrapy
да, тебе. А ты хранишь эти данные? Т.е. по-факту тебе нужна версионность что-ли? Поэтому ты хочешь привязаться  к айдишнику?
источник

NZ

Nikita Zhidkov in Scrapy
как такое возможно если ограничение по домену?
источник