Size: a a a

2020 December 03

D

Dmitry in Scrapy
Кирилл
Почему бы он должен поломать?
Нет причин - просто спросил, чтобы перестраховаться. А то начнет что-то глючить, и будет 101 причина почему - так как ничего под капотом не понимаю, решил спросить у спецов :)
источник

A

Andrii in Scrapy
Ну уже проще сделать и узнать как будет работать
источник

К

Кирилл in Scrapy
Ну, тут достаточно знать, что у скрапи один поток, а дальше как и во всех процессах, если заблочить основной поток, то асинхрон не будет работать, какой бы там реактор луп не стоял
источник

МС

Михаил Синегубов... in Scrapy
Кирилл
Ну, тут достаточно знать, что у скрапи один поток, а дальше как и во всех процессах, если заблочить основной поток, то асинхрон не будет работать, какой бы там реактор луп не стоял
просто человек еще больший параноик чем я :). это нормально
источник

К

Кирилл in Scrapy
Нужно заглянуть в твисдед хоть чуть-чуть и провести хотя бы слабую параллель с какой-то технологией с которой знаком, тогда там будет меньше магии и всё станет понятнее
источник

К

Кирилл in Scrapy
А пока это чёрный ящик, будет много страхов)
источник

B

Bulatbulat48 in Scrapy
Ruslan aka DUDE
> Использовать css селекторы чтобы избежать пробелов в названии при использовании @class в xpath

о каких пробелах идет речь?
не очень частный кейс, но иногда в ответе классы отдаются как ‘name пробел’ и в итоге точный поиск по xpath не находит, можно конечно и на xpath написать запрос, но гараздо проще через css
источник

М

Мур in Scrapy
Джентльмены, а может кто ни будь подсказать по архитектуре приложения, как лучше замутить? Стоит задача через веб интерфейс отправлять паука на целевой сайт, паук сравнивает данные в базе и либо обновляет их либо ни чего не делает, а в интерфейс уже рендерятсч либо обновлённые данные либо старые из базы
источник

М

Мур in Scrapy
В каяестве парсера выбрал Scrapy, на бэк не знаю что лучше
источник

М

Мур in Scrapy
И монолитом лучше ваять или Restfull?
источник

К

Кирилл in Scrapy
Мур
Джентльмены, а может кто ни будь подсказать по архитектуре приложения, как лучше замутить? Стоит задача через веб интерфейс отправлять паука на целевой сайт, паук сравнивает данные в базе и либо обновляет их либо ни чего не делает, а в интерфейс уже рендерятсч либо обновлённые данные либо старые из базы
Вариантов бэка на пайтоне не так уж много. И какую разницу в твоём случае ты видишь между монолитом и рестом?
источник

К

Кирилл in Scrapy
Могу посоветовать не брать klein или голый твистед под бэк, для прямой интеграции со скрапи. Я один раз ради интереса попробовал, впечатления так себе
источник

М

Мур in Scrapy
Кирилл
Вариантов бэка на пайтоне не так уж много. И какую разницу в твоём случае ты видишь между монолитом и рестом?
Ну я погуглил с фласком допустим Scrapy не очень дружит как я понял, типа можно заеостылить но так себе, а про архитектуру, я вот и не знаю, что удобнее потом поддерживать, пауков ведь регулярно нужно будет модифицировать, при изменении цс, удобно это будет делать при монолите, может кто то уже сталкивался
источник

М

Мур in Scrapy
Кирилл
Могу посоветовать не брать klein или голый твистед под бэк, для прямой интеграции со скрапи. Я один раз ради интереса попробовал, впечатления так себе
Вот может тогда и попробовать через рест?
источник

К

Кирилл in Scrapy
Мур
Ну я погуглил с фласком допустим Scrapy не очень дружит как я понял, типа можно заеостылить но так себе, а про архитектуру, я вот и не знаю, что удобнее потом поддерживать, пауков ведь регулярно нужно будет модифицировать, при изменении цс, удобно это будет делать при монолите, может кто то уже сталкивался
Скрапи дружить ни с чем не удобно. Но вместо фласка лучше джанго возьми, в сети есть разные примеры скрещивания
источник

М

Мур in Scrapy
Кирилл
Скрапи дружить ни с чем не удобно. Но вместо фласка лучше джанго возьми, в сети есть разные примеры скрещивания
Понял, спасибо, буду ковырять в этом направлении
источник

К

Кирилл in Scrapy
Мур
Вот может тогда и попробовать через рест?
В том же джанго можно делать рест + есть разные довески типа темплейтов, ORM, админки и т.п. Некоторые считают что это минус, потому что джаго выходит тяжелым, хотя если эти части нужны и их прикручивать к фласку или к fastapi, то скорее всего будет так же тяжело, да ещё и архитектура будет хуже
источник

М

Мур in Scrapy
Кирилл
В том же джанго можно делать рест + есть разные довески типа темплейтов, ORM, админки и т.п. Некоторые считают что это минус, потому что джаго выходит тяжелым, хотя если эти части нужны и их прикручивать к фласку или к fastapi, то скорее всего будет так же тяжело, да ещё и архитектура будет хуже
Ну я ещё пораскину мозгами, с джанго сталкивался поверхностно, фласк лучше изучил, и попривык уже накидывать нужные расширения
источник

К

Кирилл in Scrapy
Мур
Ну я ещё пораскину мозгами, с джанго сталкивался поверхностно, фласк лучше изучил, и попривык уже накидывать нужные расширения
Джанго маст хэв, рано или поздно всё равно понадобится
источник

М

Мур in Scrapy
Кирилл
Джанго маст хэв, рано или поздно всё равно понадобится
Это я понимаю, но времени маловато до нг что бы проект запилить
источник