Size: a a a

2019 July 01

АП

Агент Печенька in Scrapy
Михаил Синегубов
вот у меня вопрос как пайп с классом парсера синхронизируется.....
Через реактор как я помню.
источник

МС

Михаил Синегубов in Scrapy
Агент Печенька
Через реактор как я помню.
а если по русски :)
кстати, модет кто решал задачу, или видел что-то похожее
1. есть 4 паука, они делают, по сути, разные этапы парсинга.
2. исходные данные для пауков лезат в разных (для каждого паука в своей) таблицах базы
3. в эти же таблицы пауки пишут/добавляют данные.

как это все "по феншую" увязать?
источник

АП

Агент Печенька in Scrapy
Михаил Синегубов
а если по русски :)
кстати, модет кто решал задачу, или видел что-то похожее
1. есть 4 паука, они делают, по сути, разные этапы парсинга.
2. исходные данные для пауков лезат в разных (для каждого паука в своей) таблицах базы
3. в эти же таблицы пауки пишут/добавляют данные.

как это все "по феншую" увязать?
Twisted reactor.
В доке скрапи есть овервью архитектуры скрапи.
источник

МС

Михаил Синегубов in Scrapy
Агент Печенька
Twisted reactor.
В доке скрапи есть овервью архитектуры скрапи.
Ох, понятно что ничего не понятно.
Ну да ладн, спасибо и на этом. прям сей секунд отвалилась задача, а там "будет день, будем думать".... :)
источник

N

Nikolay in Scrapy
Агент Печенька
Не пиши в файл.
А куда писать если мне нужна инфа по ходу парсинга?
источник

AS

Alexander Serebrov in Scrapy
Dima Pislari
Привет, ребята! я использую scrapy. Я создал сложный парсер с цепочкой обратных вызовов, ответов и генерацией следующей url. Теперь мне нужно написать unit tests для него. Единственное, что я нашел, - это 2 ответа на stackoverflow (Betamax,  поддельные тестовые ответы). Я не представляю, как бы я мог использовать эти решения в моем случае. Может кто-нибудь объяснить шаг за шагом, как это делается, или дать ссылку на какую-либо документацию. Заранее большое спасибо!
Если ещё актуально) я делал такие тесты, но это не юнит, а интеграционные - можно проверить работает ли ещё твой паук (не изменился ли сайт источник) на самом «высоком» уровне :) а юнит тесты в случае скрапи обычно пишут для кастомных “core” компонентов: лоадеров, мидлварей, пайплайнов и тд
источник

АП

Агент Печенька in Scrapy
Итемы чем не подходят?
источник

N

Nikolay in Scrapy
Агент Печенька
Итемы чем не подходят?
Ну там больше инфа что сейчас парсится и сколько найдено страниц.
источник

i

ildar in Scrapy
Так ты это в лог кидать можешь, нет?
источник

i

ildar in Scrapy
И даже в файл лога, при этом половину этих данных скрапи тебе автоматом впишет
источник

N

Nikolay in Scrapy
Мне в другом месте выводить надо - что за паук, сколько парсит и сколько прошел
источник

АП

Агент Печенька in Scrapy
Nikolay
Ну там больше инфа что сейчас парсится и сколько найдено страниц.
Логи
источник

АП

Агент Печенька in Scrapy
Nikolay
Мне в другом месте выводить надо - что за паук, сколько парсит и сколько прошел
Настрой логи
источник

I

Ivan in Scrapy
всем привет. вопрос кто как борится с incapsula?
источник

I

Ivan in Scrapy
ну или как работать с cookies в scrapy? есть какие либо ссылки полезные?
источник

МС

Михаил Синегубов in Scrapy
Ivan
ну или как работать с cookies в scrapy? есть какие либо ссылки полезные?
источник

МС

Михаил Синегубов in Scrapy
cookies (dict or list) – the request cookies. These can be sent in two forms.

и далее по тексту
источник

I

Ivan in Scrapy
не пойму как их использовать и где...
источник
2019 July 02

АН

Алексей Нагорский in Scrapy
Ivan
не пойму как их использовать и где...
scrapy.Request(url=url, cookies=cookies)?
источник

I

Ivan in Scrapy
scrapy_splash решил все проблемы
источник