Телеграмм чат группы scrapy

такой вопрос: страница товара, с данными и несколькими фото одного товара. Данные, понятно, без проблем собираются в итемы. Нужно скачать фото и сложить по отдельным папкам к каждому товару. пробовал качать через Images Pipeline, но он переименовывает файлы в их хеш-суммы и сваливает все в один каталог. Вроде в доках написано, что можно качать не изменяя название файлов, но у меня почему то не получается... Вопрос в итоге - как качать фото не меняя имена и раскладывать по папкам, чтоб потом связать с каждой единицей товара?

источник

12:18пожаловаться #5

М

Мак in Scrapy

видел одну реализацию, но там была какая то жесть, черех PIL, BytesIO и hashlib перед заливкой в БД. Тут вопрос, можно ли это все сделать проще средствами Scrapy?

источник

12:22пожаловаться #6

К

Кирилл in Scrapy

ты сделал этот вариант из доков, с кастомным пайплайном?

источник

12:22пожаловаться #7

М

Мак in Scrapy

Кирилл

ты сделал этот вариант из доков, с кастомным пайплайном?

ну да... там где есть возможность еще вьюхи делать

источник

12:23пожаловаться #8

К

Кирилл in Scrapy

это? https://doc.scrapy.org/en/latest/topics/media-pipeline.html#scrapy.pipelines.images.ImagesPipeline.file_path

источник

12:24пожаловаться #9

М

Мак in Scrapy

именно

источник

12:24пожаловаться #10

К

Кирилл in Scrapy

    def file_path(self, request, response=None, info=None):
        return 'files/' + os.path.basename(urlparse(request.url).path)

источник

12:53пожаловаться #11

К

Кирилл in Scrapy

Мак

именно

нужно None добавить, будет работать

источник

12:53пожаловаться #12

L

László in Scrapy

Сколько у вас уходит времени на написание скраперов? В зависимости от сайта(блог <5к, магазин <100к, портал <1м)

источник

13:05пожаловаться #13

К

Кирилл in Scrapy

если ты про парсер спрашиваешь, а не сами данные, то тут больше от структуры зависит, а не от объёма

источник

13:10пожаловаться #14

МС

Михаил Синегубов in Scrapy

László

Сколько у вас уходит времени на написание скраперов? В зависимости от сайта(блог <5к, магазин <100к, портал <1м)

Ну, это то же самое, что ты ответишь на вопрос "А сколько времени уходит на подготовку этикетки к печати"
Кирилл чуть обогогнал :), можно и с одной страницей весь день проипаться, и весь магаз (без самого парсинга) за пол часа накатать :)

источник

13:10пожаловаться #15

Y

Yurii in Scrapy

Мак

такой вопрос: страница товара, с данными и несколькими фото одного товара. Данные, понятно, без проблем собираются в итемы. Нужно скачать фото и сложить по отдельным папкам к каждому товару. пробовал качать через Images Pipeline, но он переименовывает файлы в их хеш-суммы и сваливает все в один каталог. Вроде в доках написано, что можно качать не изменяя название файлов, но у меня почему то не получается... Вопрос в итоге - как качать фото не меняя имена и раскладывать по папкам, чтоб потом связать с каждой единицей товара?

https://pastebin.com/w1Pfa3M4

источник

13:28пожаловаться #16

Y

Yurii in Scrapy

И тут показано как айтем взять и не только

источник

13:29пожаловаться #17

Y

Yurii in Scrapy

pipelines.py

(2.54 Кб)

источник

13:29пожаловаться #18

М

Мак in Scrapy

спасибо, гляну позже поподробнее

источник

13:31пожаловаться #19

Y

Yurii in Scrapy

Мак

такой вопрос: страница товара, с данными и несколькими фото одного товара. Данные, понятно, без проблем собираются в итемы. Нужно скачать фото и сложить по отдельным папкам к каждому товару. пробовал качать через Images Pipeline, но он переименовывает файлы в их хеш-суммы и сваливает все в один каталог. Вроде в доках написано, что можно качать не изменяя название файлов, но у меня почему то не получается... Вопрос в итоге - как качать фото не меняя имена и раскладывать по папкам, чтоб потом связать с каждой единицей товара?

На пасте пример как на основе ссылки переименовать картинку. А как раскидывать ты можешь написать в айтем и достать айтем в пайплайне или прям там на основе урла папку новую замутить и туда кидать

источник

13:32пожаловаться #20