Телеграмм чат группы scrapy

А filtered потому что
2021-05-31 20:40:27 [py.warnings] WARNING: C:\Users\Danila\AppData\Local\Programs\Python\Python38\lib\site-packages\scrapy\spidermiddlewares\offsite.py:65: URLWarning: allowed_domains accepts only domains, not URLs. Ignoring URL entry https://tpb.party in allowed_domains.

tpb.party

Download music, movies, games, software! The Pirate Bay - The galaxy's most resilient BitTorrent site

Download music, movies, games, software and much more. The Pirate Bay is the galaxy's most resilient BitTorrent site.

источник

16:47пожаловаться #7

Andrey Rahmatullin in Scrapy

хых

источник

16:48пожаловаться #8

Danila Artyukhov in Scrapy

Ага) Ну хорошо. Спасибо большое

источник

16:49пожаловаться #9

Georgiy in Scrapy

Тут такого тоже нет

источник

16:55пожаловаться #10

Anatoli Valenda in Scrapy

Всем ку. Подскажите, не могу нагуглить. Как с помощью pyppeteer скачать файл? В данном случае, открываю pdf файл в стандартном приложении(которым хром просматривает эти файлы). Вот и вопрос, как его скачать?

источник

17:50пожаловаться #11

Alex in Scrapy

Вот здесь есть инфа:

https://coderoad.ru/56254177/%D0%9E%D1%82%D0%BA%D1%80%D0%BE%D0%B9%D1%82%D0%B5-Puppeteer-%D1%81-%D0%BE%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%BD%D0%BE%D0%B9-%D0%BA%D0%BE%D0%BD%D1%84%D0%B8%D0%B3%D1%83%D1%80%D0%B0%D1%86%D0%B8%D0%B5%D0%B9-%D1%81%D0%BA%D0%B0%D1%87%D0%B0%D1%82%D1%8C-PDF-%D0%B2%D0%BC%D0%B5%D1%81%D1%82%D0%BE-PDF-viewer

coderoad.ru

Откройте Puppeteer с определенной конфигурацией (скачать PDF вместо PDF viewer)
- CodeRoad

Puppeteer в настоящее время не поддерживает навигацию (или загрузку) PDFs в безголовом режиме так легко. Цитата из документов для функции page.goto : Примечание . безголовый режим не поддерживает...

источник

17:53пожаловаться #12

Anatoli Valenda in Scrapy

блин, косяк в том, что мне нужно это сделать через api pyppeteer

источник

18:04пожаловаться #13

(

(o_O) in Scrapy

А httpResponse.buffer() не подойдет?

источник

18:11пожаловаться #14

Alex in Scrapy

По-моему, поведение на реакции определенных типов файлов можно в профиле настраивать. Но для этого нужно использовать постоянный профиль, а не генерируемый каждый раз новый.

источник

18:12пожаловаться #15

Alex in Scrapy

У Firefox, например, это настраивается здесь 👆

источник

18:12пожаловаться #16

Anatoli Valenda in Scrapy

ладно, пороюсь еще. Если придумаю что - отпишусь

источник

18:14пожаловаться #17

(

(o_O) in Scrapy

псевдокод:
const pdf = await page.goto(pdfUrl);
const buffer = await pdf.buffer();
await writeFileAsync(filename, buffer);

источник

18:16пожаловаться #18

Anatoli Valenda in Scrapy

вы не поверите, но походу в папитире тупо нет функции сохранения пдф или файлов по URL. Все варианты это какие-то лютые костыли с заменой хидеров и прочее. Есть вариант установить флаг, чтобы pdf не открывался, а сразу сохранялся, но этот флаг можно поставить только вручную. Это пипец, господа. Хоть ты сам открывай исходники и дописывай недостающий функционал. Не понимаю почему не добавили аналог SaveAs.

источник

20:51пожаловаться #19

(

(o_O) in Scrapy

Все там есть. Чем мой способ не подошел?

источник

20:51пожаловаться #20