Телеграмм чат группы scrapy

сейчас вопрос в обратных ссылках.
есть первый сайт, с него собрали ссылки. По ним перешли:
1. обратно на первый сайт можно возвращаться (я уже понял, что это что то вроде HH, но все же)?
2. между соседними сайтами можно переходить? К примеру, получили два сайта, а у них перекресные ссылки
3. те сайты, на которые пришли с первого - их надо полностью проходить, или только до определенного уровня?

источник

09:27пожаловаться #8

МС

Михаил Синегубов... in Scrapy

уф, надеюсь понятно написал :)

источник

09:27пожаловаться #9

SoHard 🎄 in Scrapy

1. идея собрать контакты работодателей, то выходит что нет, не надо возвращаться
2. тоже нет, но я сомневаюсь что там могут быть перекресные
3. 1 уровня хватит

источник

09:30пожаловаться #10

МС

Михаил Синегубов... in Scrapy

а вообще, если не вдаваться в подробности. Я бы allowed_domains передавал в колбеки. В самом пауке вообще убрал бы параметр.
В самом колбеке ссылки доставать через LinkExtractor, ну, или с фильтром по домену.
Можно еще, дополнительно, передавать "можно ли парсить внешние ссылки"

источник

09:30пожаловаться #11

МС

Михаил Синегубов... in Scrapy

в самом LinkExtractor, есть же allowed_domains
надо просто отключить фильтр ссылок по домену самого скрапи

хз, насколько это правильно

источник

09:32пожаловаться #12

МС

Михаил Синегубов... in Scrapy

если написал непонятную хрень - спрашивай, попытаюсь объяснить :)

источник

09:32пожаловаться #13

SoHard 🎄 in Scrapy

сделал такое LinkExtractor(allow_domains=urlparse(response.url).netloc)

источник

13:08пожаловаться #14

МС

Михаил Синегубов... in Scrapy

ииии? :)

источник

13:08пожаловаться #15

SoHard 🎄 in Scrapy

вроде как работает) отписал вдруг кто поиском будет пользоваться и ему поможет

источник

13:11пожаловаться #16

МС

Михаил Синегубов... in Scrapy

аа, так и написал бы сразу, "вроде норм", а то написал что сделал и хз, может "нихрена ничего не работает" 😀😂

источник

13:12пожаловаться #17

Murilo Andrade in Scrapy

Здравствуйте, у меня вопрос. После прохождения страницы с логином и паролем мне нужно было бы нажать кнопку, которая переводит меня на другую страницу, как у меня такое поведение?

источник

15:37пожаловаться #18

МС

Михаил Синегубов... in Scrapy

Maybe you should write in English? :)

или я не так имя понял :)

источник

15:43пожаловаться #19

МС

Михаил Синегубов... in Scrapy

F12 -> Network
Смотреть запросы, с помощью которых происходит переход на страницу.
Но, это не всегда требуется. Чаще всего, этот шаг можно пропустить и сразу запрашивать страницу с данным.

источник

15:45пожаловаться #20