Size: a a a

2021 June 03

AR

Andrey Rahmatullin in Scrapy
итемы не все запишутся например
источник

AR

Andrey Rahmatullin in Scrapy
хотя если к тому времени раннер отдал управление то всё должно быть ок
источник

MZ

Marsel Ziatdinov in Scrapy
Всё, теперь и логи работают. Сейчас yield пропишу и будет всё ок. Спасибо)
источник

A

Andrii in Scrapy
Hello, как лучше сохранять raw страниц ? response.text? response.body?
источник

AR

Andrey Rahmatullin in Scrapy
смотря что хочется получить
источник

AR

Andrey Rahmatullin in Scrapy
body это сырые байты от сервера, text это юникод
источник

AR

Andrey Rahmatullin in Scrapy
наверно лучше text сохранять
источник

A

Andrii in Scrapy
☝️💪
источник

SS

Sergey Sergey in Scrapy
Кто пользуется scrapy-rotating-proxies, подскажите. Как полностью убрать проверку прокси и таймаут?
Или подскажите прокси ротатор, который не будет проверять прокси навалидность, таймауты делать и другую фигню. А будет просто перебирать их и использовать пока не получит данные.
источник

МС

Михаил Синегубов... in Scrapy
если по русски "не пытаться вернуть плохой прокси в валидные" ?
источник

SS

Sergey Sergey in Scrapy
если по русски, то не пытаться их сортировать на валидные или нет. Не исключать «плохие», и так далее
источник

МС

Михаил Синегубов... in Scrapy
а что с плохими делать?
источник

SS

Sergey Sergey in Scrapy
да ничего. Просто пробовать другой прокси из списка. У меня мобильные прокси которые сами ротируются
источник

S

SoHard 🎄 in Scrapy
тогда зачем ротатор?
источник

МС

Михаил Синегубов... in Scrapy
то что мобильные сами ротируются, там же, просо отдается один входной адрес, а прокси в "черном ящике" крутятся
источник

S

SoHard 🎄 in Scrapy
ротатор поверх ротатора
источник

МС

Михаил Синегубов... in Scrapy
может просто нужна хренова куча попыток?
источник

SS

Sergey Sergey in Scrapy
ато один ротатор проверяет их с таймаутами дикими. Другой убирвет из списка если не получил данные. А нужен самый простой.
источник

SS

Sergey Sergey in Scrapy
Да нужна, но без вот этой всей самодеятельности
источник

S

SoHard 🎄 in Scrapy
если они сами ротируются то у тебя там 1 адрес должен быть
источник