Телеграмм чат группы scrapy

Size: a a a

Scrapy

378 membersпожаловаться на группу

2018 July 09

Bulatbulat48 in Scrapy

в settings

источник

11:11пожаловаться #1

Bulatbulat48 in Scrapy

ITEM_PIPELINES = {'scrapy.pipelines.images.ImagesPipeline': 1}

источник

11:12пожаловаться #2

Bulatbulat48 in Scrapy

в items.py

источник

11:12пожаловаться #3

Bulatbulat48 in Scrapy

class MyItem(scrapy.Item):

    # ... other item fields ...
    image_urls = scrapy.Field()
    images = scrapy.Field()

источник

11:12пожаловаться #4

Bulatbulat48 in Scrapy

добавляешь два поля

источник

11:12пожаловаться #5

Bulatbulat48 in Scrapy

и из паука в items передаешь ссылку вроде как

источник

11:13пожаловаться #6

Bulatbulat48 in Scrapy

           for img_url in json_resp:
                l = ItemLoader(item=MyItem(), response=response)
                l.add_value('image_urls', img_url['photo_604'])
                yield l.load_item()

источник

11:14пожаловаться #7

Bulatbulat48 in Scrapy

вообщем все просто)

источник

11:15пожаловаться #8

Bulatbulat48 in Scrapy

а если кастомизировать нужно то крутишь это дело в pipelines.py

источник

11:16пожаловаться #9

Bulatbulat48 in Scrapy

class MyImagesPipeline(ImagesPipeline):

    def get_media_requests(self, item, info):
        return [scrapy.Request(x, meta={'image_name': str(item['accession'][0]) + '/' + 'prt_' + x.split('/')[-4]})
                for x in item.get('image_urls', [])]

def file_path(self, request, response=None, info=None):
        return '%s.jpg' % request.meta['image_name']

источник

11:16пожаловаться #10

Bulatbulat48 in Scrapy

например вот так

источник

11:16пожаловаться #11

Bulatbulat48 in Scrapy

надо какой-нить реп завести с faq-ом )

источник

11:21пожаловаться #12

Bulatbulat48 in Scrapy

типа как у беггинерсов)

источник

11:21пожаловаться #13

Danil Denysenko in Scrapy

хД

источник

11:22пожаловаться #14

Danil Denysenko in Scrapy

Bulatbulat48

я requests-ом качал

там надо использовать какой-то User agent, если я не ошибаюсь

источник

11:22пожаловаться #15

Bulatbulat48 in Scrapy

Danil Denysenko

там надо использовать какой-то User agent, если я не ошибаюсь

ну в реквестс он идет по дефолту, но и в скрапи есть scrapy.request вроде как

источник

11:23пожаловаться #16

Bulatbulat48 in Scrapy

@ebadanin можно встроенным scrapy.request делать запрос?

источник

11:23пожаловаться #17

Alexander Serebrov in Scrapy

я в тестах делал))

источник

11:33пожаловаться #18

Alexander Serebrov in Scrapy

думаю можно

источник

11:33пожаловаться #19

Alexander Serebrov in Scrapy

from scrapy.http import HtmlResponse, Request, TextResponse

 
       scrapy_request = Request(
            product_url,
            headers={'meta': meta},
            callback=spider.parse_product_page
        )
        scrapy_response = TextResponse(
            product_url,
            body=response.content,
            request=scrapy_request
        )
        scrapy_response.meta['item'] = meta['item']
        yield spider.parse_product_page(scrapy_response)

источник

11:33пожаловаться #20