Подскажите, пожалуйста. Есть несколько вопросов:
1. В чем преимущество Xpath против того же bs4?
2. Вместо selenium'a кто-то использовал nightmare? Есть преимущества какие-то?
3. Какую БД лучше использовать, если нужно хранить данные?
4. Я обычно писал отдельные пауки. Если нужно делать целый проект, где будет множество сайтов, и соответственно пауков. Как это делается?
Может отвечу несовсем корректно, надеюсь если что поправят..
1)xpath-язык запросов к xml (ну и следовательно к html) bs4(не использовал) - написано что библиотека для получения данных из html и xml, то есть не совсем понимаю как их можно сравнить))
2)не использовал не могу сказать
3)зависит от данных, если просто каталог и связей нет, то nosql (в случае со скрапи там есть модуль с mongodb) если есть отношения между данными то любую реляционную, однако в сами бд я не силен, есть еще разновидности (например колоночные) тут нужно более конкретно поставить вопрос
4)я точно не уверен, но слышал есть связка с django и видос на ютубе где чел показывает что-то типо окружения (scrapy django item вроде называется)