Size: a a a

2020 November 30

B

Balloon Fighter 🎈 in Scrapy
Спасибо всем за ответы, я приду домой сейчас и попробую все это.
источник

ПА

Павел Асеев... in Scrapy
Привет, подскажите как быть если нужен экспорт в яндексовский файл YML? Напрямую со скрэпи генерировать или сначала в базу данных и там уже как то его оттуда генерировать? У кого-нибудь есть опыт? Подскажите 🙂
источник

МС

Михаил Синегубов... in Scrapy
Павел Асеев
Привет, подскажите как быть если нужен экспорт в яндексовский файл YML? Напрямую со скрэпи генерировать или сначала в базу данных и там уже как то его оттуда генерировать? У кого-нибудь есть опыт? Подскажите 🙂
а данных много?
источник

ПА

Павел Асеев... in Scrapy
Да. 8-10 тысяч товаров.
источник

AR

Andrey Rahmatullin in Scrapy
Напрямую
источник

AR

Andrey Rahmatullin in Scrapy
Павел Асеев
Да. 8-10 тысяч товаров.
Это мало
источник

OS

Oleg Shleiko in Scrapy
а если парсинг оборвётся? По новой маслать?
источник

МС

Михаил Синегубов... in Scrapy
ну, это мало. Можно и накопить в пайпе и сбросить. Это если надо собрать данные из кусочков.
если каждый айтем на выходе независимый, то по принципу записи в XML/JSON
источник

МС

Михаил Синегубов... in Scrapy
Oleg Shleiko
а если парсинг оборвётся? По новой маслать?
10 тыс? проще заново
источник

AR

Andrey Rahmatullin in Scrapy
Oleg Shleiko
а если парсинг оборвётся? По новой маслать?
Как проще
источник

ПА

Павел Асеев... in Scrapy
Там нужно сначала всё собрать, а потом уже генерировать файл, там категории формируются в начале файла и по ID привязываются к товарам.
источник

AR

Andrey Rahmatullin in Scrapy
А
источник

AR

Andrey Rahmatullin in Scrapy
.jl и потом скриптом обработать
источник

D

Dmitry in Scrapy
Все-таки в scrapy не хватает функционала синхронизации подреквестов. Еще один простой пример. В рамках парса мне нужно положить 100 товаров в корзину (отправить 100 POST реквестов) и потом разом спарсить всю корзину. Но проблема в том, что я могу спарсить всю корзину только тогда, когда все 100 реквестов выполнятся, что я никак не могу знать - после отправки под-реквестов они начинают жить своей жизнью.
источник

A

Andrii in Scrapy
Dmitry
Все-таки в scrapy не хватает функционала синхронизации подреквестов. Еще один простой пример. В рамках парса мне нужно положить 100 товаров в корзину (отправить 100 POST реквестов) и потом разом спарсить всю корзину. Но проблема в том, что я могу спарсить всю корзину только тогда, когда все 100 реквестов выполнятся, что я никак не могу знать - после отправки под-реквестов они начинают жить своей жизнью.
Допишите
источник

D

Dmitry in Scrapy
Если бы это было так просто, то это давно уже дописали бы. Там же внутри жуткий twisted сидит 😱
источник

AR

Andrey Rahmatullin in Scrapy
inline-requests
источник

D

Dmitry in Scrapy
А этот привет из 2016 точно работает?
источник

AR

Andrey Rahmatullin in Scrapy
пока никто не жаловался
источник

AR

Andrey Rahmatullin in Scrapy
Dmitry
Если бы это было так просто, то это давно уже дописали бы. Там же внутри жуткий twisted сидит 😱
не в твистеде проблема, а в лайфсайкле реквестов
источник