Size: a a a

2020 April 17

AC

Alexander Chaptykov in Scrapy
а как?
я щас вот так реализовал
scrapy crawl splash -s CUSTOM_PIPE="{'crawler.pipelines.init…

а потом уже делаю парсинг и вставляю немного в обход получилось
источник

К

Кирилл in Scrapy
Извращения
источник

AC

Alexander Chaptykov in Scrapy
а как надо?
источник

К

Кирилл in Scrapy
Интересна ситуация, при которой нужно постоянно пайпы менять
источник

AC

Alexander Chaptykov in Scrapy
ну у меня например настройки запуска такие
спайдер - имя
источник урлов- таблица
лимит - сколко берем
параметры обработки - разные пайпы разные параметры логирования
куда кладем результат - имя таблицы
источник

AC

Alexander Chaptykov in Scrapy
и когда нужно что-то отдебажить то надо быстро поменять настройки и когда это все раскидано на 2-3 файла то неудобно
источник

AC

Alexander Chaptykov in Scrapy
гораздо легче менять настройки в одном месте
источник

AC

Alexander Chaptykov in Scrapy
иногда нужно быстро пробить 2-3 урла
источник

AC

Alexander Chaptykov in Scrapy
например с определенными параметрами парсинга
источник

tt

timuchin telegram in Scrapy
Всем привет. подскажите, как записать значение в таблицу игнорируя дубликаты, с помощью sqlalchemy?
источник

К

Кирилл in Scrapy
Alexander Chaptykov
а как надо?
Та в общем-то, используй если работет
Только пайпы для обработки данных, а не для лимитов и источников

как вариант, это кастомные комманды, там можно задавать настройки, и параметры через -a которые передаются в паук
источник

К

Кирилл in Scrapy
timuchin telegram
Всем привет. подскажите, как записать значение в таблицу игнорируя дубликаты, с помощью sqlalchemy?
какая бд
источник

tt

timuchin telegram in Scrapy
sqlite
источник

AC

Alexander Chaptykov in Scrapy
ну у меня пайп например есть который создает список start_urls и я могу быстро поменять пайп ответственный за создание этого списка, т.к. список может быть из разных баз и таблиц или из цсв
источник

AC

Alexander Chaptykov in Scrapy
но если есть идея, как сделать лучше буду рад, если поделишься
источник

К

Кирилл in Scrapy
источник

tt

timuchin telegram in Scrapy
ошибка ушла, но в таблицу пишется всякая охинея
источник

tt

timuchin telegram in Scrapy
*ахиня
источник

К

Кирилл in Scrapy
Alexander Chaptykov
ну у меня пайп например есть который создает список start_urls и я могу быстро поменять пайп ответственный за создание этого списка, т.к. список может быть из разных баз и таблиц или из цсв
я бы прописал это в пауке, а паук бы брал имя нужной базы из настроек
источник

AC

Alexander Chaptykov in Scrapy
так там надо еще и коннекторы прописывать
источник