Size: a a a

2020 March 17

AR

Andrey Rahmatullin in Scrapy
подумать как ты будешь запускать пауков
источник

BK

Boris Krutskih in Scrapy
Andrey Rahmatullin
подумать как ты будешь запускать пауков
Ну хотелось бы через веб-интерфейс
источник

МС

Михаил Синегубов in Scrapy
ну, я бы по другому вопрос поставил: "а что вообще хочется", на самом ли деле нужна своя веб админка?.
99% потребностей перекрывает консолька. Но да, я еще то динозавр :)
источник

МС

Михаил Синегубов in Scrapy
Boris Krutskih
Ну хотелось бы через веб-интерфейс
посмотри в сторону:
1. https://github.com/my8100/scrapydweb
2. https://github.com/crawlab-team/crawlab (у него еще список есть админок)

может оно и перекроет твои потребности
источник

BK

Boris Krutskih in Scrapy
Михаил Синегубов
ну, я бы по другому вопрос поставил: "а что вообще хочется", на самом ли деле нужна своя веб админка?.
99% потребностей перекрывает консолька. Но да, я еще то динозавр :)
нужно парсить цены с магазинов и складывать все это дело куда-то, для этого и хотел к джанго взять прикрутить, если есть лучше варианты, с радостью послушал бы))
источник

МС

Михаил Синегубов in Scrapy
блин, спарсить куда-то, взять что-то, подучить непонятно что...
что с данными дальше будет?
источник

i

ildar in Scrapy
источник

i

ildar in Scrapy
Но там автор последний год похоже пилит крипту
источник

i

ildar in Scrapy
Михаил Синегубов
блин, спарсить куда-то, взять что-то, подучить непонятно что...
что с данными дальше будет?
Лично мне надо список подобного от пробовавших, с выводом стоит что-то или нет  как часть комбайна, или пилить тупо свой велик для организации workflow. Чтоб туда сверху вкрутить слежку за ресурсами, по которым определять, что данные устарели(scrapy/selenium) , потом старт пауков, инфа все ли хорошо прошло(не обязательно даже гуи, нехай хоть в телегу значимые ошибки шлет, типа "ой чет с сайта собралось ноль данных")-любая телегобот/ скрапид?, и потом еще сверху  прикрученное раскидываение полученных данных, где-то по базам, где-то может и в cms сайтов, где-то на почту или телегу послать. А то вдруг бриллиантовое решение уже есть. Короче, лень и вера в серебряную пулю.
источник

i

ildar in Scrapy
Больше даже про организацию клея для всего этого зоопарка. Сам думаю очередь меня спасет. Аля celery/dramatiq. И может быть сверху джангу, но это не так важно уже.
источник

AR

Andrey Rahmatullin in Scrapy
бриллиантовое решение не бывает, потому что одним надо выгрузку в экселе глазами смотреть, другим в стороннюю систему грузить, третьим ещё что-то
источник

AR

Andrey Rahmatullin in Scrapy
для уведомлений о статусе завершившихся джобов есть  spidermon
источник

i

ildar in Scrapy
А про workflow передовая наука что говорит? Где порядок действий a->b->c->d с возможными ветвлениями, вида "если b такое-то идем по c1, иначе по c2". Если b сдохло - сделай попробуй еще раз или плачь в телегу. Это же очереди, аля celery? Или что-то повыше уровнем взять, но все еще легковесное. А то глаза разбегаются: https://github.com/pditommaso/awesome-pipeline
источник

i

ildar in Scrapy
источник

AB

Alexander B in Scrapy
Boris Krutskih
нужно парсить цены с магазинов и складывать все это дело куда-то, для этого и хотел к джанго взять прикрутить, если есть лучше варианты, с радостью послушал бы))
бро, поделись инфой про объемы? кол-во магазов, кол-во позиций в базе, ожидание / реальность?
источник

AB

Alexander B in Scrapy
по сабжу я лично присматриваюсь к airflow, но пока только в мечтах
источник

BK

Boris Krutskih in Scrapy
Михаил Синегубов
блин, спарсить куда-то, взять что-то, подучить непонятно что...
что с данными дальше будет?
Ну как я себе это вижу.
Есть у нас обычный веб-интерфейс куда будет логиниться пользователь, у него есть доступ к функицоналу.
- Добавить сайт для парсинга
- Выгрузка в excel
- import excel своих товаров и т д
источник

BK

Boris Krutskih in Scrapy
Alexander B
бро, поделись инфой про объемы? кол-во магазов, кол-во позиций в базе, ожидание / реальность?
Магазов бы хотелось охватить большое кол-во но так как ресурсов толком нету) то можно потренироваться и на малом количестве
источник

МС

Михаил Синегубов in Scrapy
"- import excel своих товаров и т д" - это что, магазин будет?
источник

BK

Boris Krutskih in Scrapy
Михаил Синегубов
"- import excel своих товаров и т д" - это что, магазин будет?
нет, это чтобы можно было свои товары сравнить по ценам в магазинах конкурентов
источник