Size: a a a

2019 August 02

М

Мак in Scrapy
так юзер аген то на что
источник

АН

Алексей Нагорский in Scrapy
Окей, я проверю
источник

К

Кирилл in Scrapy
у селениума есть юзер агент, это же нормальный браузер
источник

К

Кирилл in Scrapy
если ты его конечно не запускаешь с каким-нибудь фантомом
источник

М

Мак in Scrapy
такой вопрос: страница товара, с данными и несколькими фото одного товара. Данные, понятно, без проблем собираются в итемы. Нужно скачать фото и сложить по отдельным папкам к каждому товару. пробовал качать через Images Pipeline, но он переименовывает файлы в их хеш-суммы и сваливает все в один каталог. Вроде в доках написано, что можно качать не изменяя название файлов, но у меня почему то не получается... Вопрос в итоге - как качать фото не меняя имена и раскладывать по папкам, чтоб потом связать с каждой единицей товара?
источник

М

Мак in Scrapy
видел одну реализацию, но там была какая то жесть, черех PIL, BytesIO и hashlib перед заливкой в БД. Тут вопрос, можно ли это все сделать проще средствами Scrapy?
источник

К

Кирилл in Scrapy
ты сделал этот вариант из доков, с кастомным пайплайном?
источник

М

Мак in Scrapy
Кирилл
ты сделал этот вариант из доков, с кастомным пайплайном?
ну да... там где есть возможность еще вьюхи делать
источник

К

Кирилл in Scrapy
источник

М

Мак in Scrapy
именно
источник

К

Кирилл in Scrapy
    def file_path(self, request, response=None, info=None):
       return 'files/' + os.path.basename(urlparse(request.url).path)
источник

К

Кирилл in Scrapy
Мак
именно
нужно None добавить, будет работать
источник

L

László in Scrapy
Сколько у вас уходит времени на написание скраперов? В зависимости от сайта(блог <5к, магазин <100к, портал <1м)
источник

К

Кирилл in Scrapy
если ты про парсер спрашиваешь, а не сами данные, то тут больше от структуры зависит, а не от объёма
источник

МС

Михаил Синегубов in Scrapy
László
Сколько у вас уходит времени на написание скраперов? В зависимости от сайта(блог <5к, магазин <100к, портал <1м)
Ну, это то же самое, что ты ответишь на вопрос "А сколько времени уходит на подготовку этикетки к печати"
Кирилл чуть обогогнал :), можно и с одной страницей весь день проипаться, и весь магаз (без самого парсинга) за пол часа накатать :)
источник

Y

Yurii in Scrapy
Мак
такой вопрос: страница товара, с данными и несколькими фото одного товара. Данные, понятно, без проблем собираются в итемы. Нужно скачать фото и сложить по отдельным папкам к каждому товару. пробовал качать через Images Pipeline, но он переименовывает файлы в их хеш-суммы и сваливает все в один каталог. Вроде в доках написано, что можно качать не изменяя название файлов, но у меня почему то не получается... Вопрос в итоге - как качать фото не меняя имена и раскладывать по папкам, чтоб потом связать с каждой единицей товара?
источник

Y

Yurii in Scrapy
И тут показано как айтем взять и не только
источник

Y

Yurii in Scrapy
источник

М

Мак in Scrapy
спасибо, гляну позже поподробнее
источник

Y

Yurii in Scrapy
Мак
такой вопрос: страница товара, с данными и несколькими фото одного товара. Данные, понятно, без проблем собираются в итемы. Нужно скачать фото и сложить по отдельным папкам к каждому товару. пробовал качать через Images Pipeline, но он переименовывает файлы в их хеш-суммы и сваливает все в один каталог. Вроде в доках написано, что можно качать не изменяя название файлов, но у меня почему то не получается... Вопрос в итоге - как качать фото не меняя имена и раскладывать по папкам, чтоб потом связать с каждой единицей товара?
На пасте пример как на основе ссылки переименовать картинку. А как раскидывать ты можешь написать в айтем и достать айтем в пайплайне или прям там на основе урла папку новую замутить и туда кидать
источник