Телеграмм чат группы scrapy_python страница 2090

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Scrapy

663 membersпожаловаться на группу

2020 October 19

AБ

Asen Баал in Scrapy

document.querySelectorAll('iframe.js-relap-widget')

хм, блин, спасибо, вроде пробовал так но не шло, кстати переодически сайт перестаёт отвечать и не выдаёт вообще ни одного ifram'a пока не перезагрузишь, может в тот момент пытался

источник

11:44пожаловаться #1

AБ

Asen Баал in Scrapy

А почему действительно iframe может быть загружен, но не всегда доступен?

источник

11:51пожаловаться #2

A

Andrii in Scrapy

хочу сделать мидлвар вейбек машин,

class WaybackMiddleware(object):
    def process_request(self, request, spider):
        if 'web.archive.org' not in request.url:
            new_url = 'http://archive.org/wayback/available?url=' + request.url
            request = request.replace(url=new_url)
        return request

но на таком после пуска зависает скрейпи

2020-10-19 12:05:43 [scrapy.middleware] INFO: Enabled item pipelines:
['crawlers.pipelines.SourceDownloaderPipeline',
 'crawlers.pipelines.SourceExampleProfilesPipeline']
2020-10-19 12:05:43 [scrapy.core.engine] INFO: Spider opened

2020-10-19 12:05:43 [scrapy.extensions.logstats] INFO: Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)
2020-10-19 12:05:43 [scrapy.extensions.telnet] INFO: Telnet console listening on 127.0.0.1:6023

`

источник

12:06пожаловаться #3

AR

Andrey Rahmatullin in Scrapy

читай что надо возвращать из методов мидлварей

источник

12:12пожаловаться #4

A

Andrii in Scrapy

просто делаю return request и оно висит (

источник

12:13пожаловаться #5

AR

Andrey Rahmatullin in Scrapy

читай что надо возвращать из методов мидлварей

источник

12:13пожаловаться #6

К

Кирилл in Scrapy

process_request() should either: return None, return a Response object, return a Request object, or raise IgnoreRequest.

источник

12:20пожаловаться #7

A

Andrii in Scrapy

а может кто носом прям в ошибку? потому что просто меняю адрес с вейбек на что-то другое так все работает

источник

12:24пожаловаться #8

AR

Andrey Rahmatullin in Scrapy

изи

источник

12:24пожаловаться #9

AR

Andrey Rahmatullin in Scrapy

If it returns a Request object, Scrapy will stop calling process_request methods and reschedule the returned request. Once the newly returned request is performed, the appropriate middleware chain will be called on the downloaded response.

источник

12:24пожаловаться #10

AR

Andrey Rahmatullin in Scrapy

а ты это так и не прочитал

источник

12:24пожаловаться #11

AR

Andrey Rahmatullin in Scrapy

ну или прочитал, но не понял, но нам этого неизвестно

источник

12:26пожаловаться #12

AR

Andrey Rahmatullin in Scrapy

у тебя реквест бесконечно отправляется обратно в process_request потому что условие кривое

источник

12:26пожаловаться #13

AR

Andrey Rahmatullin in Scrapy

ну и если бы оно было прямое, всё равно была бы херня скорее всего

источник

12:27пожаловаться #14

A

Andrii in Scrapy

а как правильно сделать?

источник

12:28пожаловаться #15

AR

Andrey Rahmatullin in Scrapy

что именно?

источник

12:28пожаловаться #16

К

Кирилл in Scrapy

просто читай что надо возвращать из методов мидлварей )

источник

12:29пожаловаться #17

AR

Andrey Rahmatullin in Scrapy

для начала ты понимаешь что такой иф ведёт к бесконечному циклу даже когда в целом логика правильная?

источник

12:29пожаловаться #18

A

Andrii in Scrapy

что с ИФ что без, результат один же

источник

12:30пожаловаться #19

A

Andrii in Scrapy

def process_request(self, request, spider):
        new_url = 'http://archive.org/wayback/available?url=' + request.url
        request = request.replace(url=new_url)
        return request

источник

12:31пожаловаться #20