Size: a a a

2020 March 16

К

Кирилл in Scrapy
Андрей выше скинул
источник

К

Кирилл in Scrapy
насколько понял, это чтоб не создаваля открывающий символы для последовательностей
источник

К

Кирилл in Scrapy
типа [
источник

К

Кирилл in Scrapy
но файл всё равно будет создан
источник

i

ildar in Scrapy
Аа, ононочо. Файл всегда создаст, просто чекает чтоб если таки нет айтемов, не писался [
источник

AR

Andrey Rahmatullin in Scrapy
да, и я не знаю что делала эта настройка до этого изменения, честно говоря
источник

i

ildar in Scrapy
Слышал тут что скрапи 2 создает новый файл вместо добавления в старый. По идее можно добавить в свой код тогда проверку на размер и удалять. А в старых версиях - на дату создания.
источник

К

Кирилл in Scrapy
Повесь свой обработчик на сигнал закрытия паука, с проверкой размера файла
источник

AR

Andrey Rahmatullin in Scrapy
а, понятно, до этого оно просто не копировало файл в удалённый сторадж, если итемов нет
источник

К

Кирилл in Scrapy
ildar
Слышал тут что скрапи 2 создает новый файл вместо добавления в старый. По идее можно добавить в свой код тогда проверку на размер и удалять. А в старых версиях - на дату создания.
Это же от имени файла зависит, если имя без переменных, будет один файл
источник

i

ildar in Scrapy
Ну так то да, опция звучит многообещающе
источник

i

ildar in Scrapy
Кирилл
Это же от имени файла зависит, если имя без переменных, будет один файл
Не совсем понял. Там еще имена полей в тот же csv в старых версиях каждый раз добавляются. Поэтому лучше по дате создания проверять
источник

S

Snoop Duck in Scrapy
Всем спасибо, я просто неправильно интерпретировал назначение опции FEED_STORE_EMPTY
источник

i

ildar in Scrapy
Да я б его также интерпретировал наверно)
источник

AR

Andrey Rahmatullin in Scrapy
вешайте тикет
источник

К

Кирилл in Scrapy
ildar
Не совсем понял. Там еще имена полей в тот же csv в старых версиях каждый раз добавляются. Поэтому лучше по дате создания проверять
источник

i

ildar in Scrapy
(И тут все как тараканы фыррр)
источник

К

Кирилл in Scrapy
если будет time в имени, будет всегда новый файл
источник

К

Кирилл in Scrapy
ildar
(И тут все как тараканы фыррр)
:D просто те, кто умеют, сами сделают обрабочик, а те кто не умеют не будут писать тикет
источник

AB

Alexander B in Scrapy
Привет всем) ловлю такие 500ки на паре сайтов, потом тыкаюсь в shell/fetch и норм открывает:
2020-03-16 14:15:16 [scrapy.spidermiddlewares.httperror] INFO: Ignoring response <503 https://www.ololo.ru/ololo/>: HTTP status code is not handled or not allowed
2020-03-16 01:32:42 [scrapy.downloadermiddlewares.retry] DEBUG: Retrying <GET https://ololo2.ru/ololo2/> (failed 1 times): 500 Internal Server Error
Я
так понимаю может надо охладить пыл? Автотротл такой стоит
custom_settings = {
       'AUTOTHROTTLE_ENABLED': True,
       'AUTOTHROTTLE_START_DELAY': 5,
       'AUTOTHROTTLE_MAX_DELAY': 60,
   }
источник