Size: a a a

2021 April 21

OS

Oleg Shleiko in Scrapy
что ты имеешь ввиду под нодой?
источник

МС

Михаил Синегубов... in Scrapy
транзакции, многопользовательский доступ и прочая хренотень
источник

A

Andrii in Scrapy
Ну видимо бд не успевает 48 пауков писать
источник

МС

Михаил Синегубов... in Scrapy
кста, двиг какой?
источник

A

Andrii in Scrapy
Двиг?
источник

МС

Михаил Синегубов... in Scrapy
что за база?
источник

A

Andrii in Scrapy
Внутреная скрапида
источник

A

Andrii in Scrapy
Та что он для логирования юзает
источник

МС

Михаил Синегубов... in Scrapy
SQLite, postresql, MySQL....
источник

OS

Oleg Shleiko in Scrapy
там редис вроде, не?
источник

A

Andrii in Scrapy
Постгрес как я помню
источник

МС

Михаил Синегубов... in Scrapy
ээээ, че то я ничего, кроме SQLite не нахожу по исходникам...
оно точно в базу пишет?
источник

A

Andrii in Scrapy
Блин, то скрапидвеб база)
источник

МС

Михаил Синегубов... in Scrapy
ну, а пауки куда кладут? уж не JsonLines ?
источник

МС

Михаил Синегубов... in Scrapy
чет мне помнится, что скрапид только как "управление работой", а "хранение данных - забота пользователя"
но это не точно
источник

A

Andrii in Scrapy
Имено)
источник

П

Пастырь in Scrapy
ребят, а не подскажете с реализацией.
Как я могу реализовать цикличный запуск паука, без потери инстанса.
Допустим мне нужно чекать каждые 30 секунд одну страницу, и при добавлении новых урл распаршивать их. После чего запускать чек по новой
источник

П

Пастырь in Scrapy
Если я это реализую перед закрытием паука, все равно же шедуль хранит посещеные адреса?
источник

МС

Михаил Синегубов... in Scrapy
Хранит, но ты можешь сказать dont_filter = True.
И хранит не шедулер а фильтр дубликатов
источник

П

Пастырь in Scrapy
у меня урлы програмно чистятся, с помощью list(set()), и из базы берутся для чека
источник