Телеграмм чат группы scrapy

Подскажите, пожалуйста. Есть несколько вопросов:
1. В чем преимущество Xpath против того же bs4?
2. Вместо selenium'a кто-то использовал nightmare? Есть преимущества какие-то?
3. Какую БД лучше использовать, если нужно хранить данные?
4. Я обычно писал отдельные пауки. Если нужно делать целый проект, где будет множество сайтов, и соответственно пауков. Как это делается?

источник

09:16пожаловаться #12

DD

Danil Denysenko in Scrapy

Спасибо:)

источник

09:16пожаловаться #13

NK

ID:507308625 in Scrapy

Danil Denysenko

Подскажите, пожалуйста. Есть несколько вопросов:
1. В чем преимущество Xpath против того же bs4?
2. Вместо selenium'a кто-то использовал nightmare? Есть преимущества какие-то?
3. Какую БД лучше использовать, если нужно хранить данные?
4. Я обычно писал отдельные пауки. Если нужно делать целый проект, где будет множество сайтов, и соответственно пауков. Как это делается?

1. никаких, кому как удобнее. по крайней мере не нужно лишний раз пип инсталл делать) а так разницы нет.

источник

10:20пожаловаться #14

NK

ID:507308625 in Scrapy

2. нет, думаю, что преимуществ и нет как таковых. но погуглю ради любопытства

источник

10:20пожаловаться #15

MS

Misha Smirnov in Scrapy

ID:507308625

2. нет, думаю, что преимуществ и нет как таковых. но погуглю ради любопытства

малость перебил, извиняюсь, надеюсь сразу поправишь))

источник

10:23пожаловаться #16

MS

Misha Smirnov in Scrapy

Danil Denysenko

Подскажите, пожалуйста. Есть несколько вопросов:
1. В чем преимущество Xpath против того же bs4?
2. Вместо selenium'a кто-то использовал nightmare? Есть преимущества какие-то?
3. Какую БД лучше использовать, если нужно хранить данные?
4. Я обычно писал отдельные пауки. Если нужно делать целый проект, где будет множество сайтов, и соответственно пауков. Как это делается?

Может отвечу несовсем корректно, надеюсь если что поправят..
1)xpath-язык запросов к xml (ну и следовательно к html) bs4(не использовал) - написано что библиотека для получения данных из html и xml, то есть не совсем понимаю как их можно сравнить))
2)не использовал не могу сказать
3)зависит от данных, если просто каталог и связей нет, то nosql (в случае со скрапи там есть модуль с mongodb) если есть отношения между данными то любую реляционную, однако в сами бд я не силен, есть еще разновидности (например колоночные) тут нужно более конкретно поставить вопрос
4)я точно не уверен, но слышал есть связка с django и видос на ютубе где чел показывает что-то типо окружения (scrapy django item вроде называется)

источник

10:23пожаловаться #17

2018 June 23

N

Nazar in Scrapy

Коллеги, всем привет!(простите!)

источник

23:50пожаловаться #18

N

Nazar in Scrapy

Подскажите пожалуйста, чядн

источник

23:50пожаловаться #19

N

Nazar in Scrapy

Есть xpath запрос //div[@class='paginator']/*/a[position()>last()-2] который возвращает результат в виде чисел, то бишь текс в ссылке.
scrapy же response.xpath("//div[@class='paginator']/*/a[position()>last()-2]") возвращает сами линки и не ясно, как добраться до текста

источник

23:52пожаловаться #20