Телеграмм чат группы scrapy_python страница 2230

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Scrapy

708 membersпожаловаться на группу

2020 November 22

AC

A C in Scrapy

Привет! Ты знаешь, как заставить скрапацию ждать между start_urls?
Я поставил DOWNLOAD_DELAY = 5, но в какой-то момент у меня все еще была ошибка 403 для сайта, чей robots.txt:

источник

17:59пожаловаться #1

AC

A C in Scrapy

'''
User-agent: *
Disallow: /member/post
Disallow: /member/login
Disallow: /member/index_do
Disallow: /member/pm
Disallow: /report.php
Disallow: /ajax
Disallow: /item.php
'''

источник

18:00пожаловаться #2

A

Andrii in Scrapy

Скрапацию?)

источник

18:00пожаловаться #3

AR

Andrey Rahmatullin in Scrapy

A C

Привет! Ты знаешь, как заставить скрапацию ждать между start_urls?
Я поставил DOWNLOAD_DELAY = 5, но в какой-то момент у меня все еще была ошибка 403 для сайта, чей robots.txt:

да, DOWNLOAD_DELAY

источник

18:01пожаловаться #4

AC

A C in Scrapy

Andrii

Скрапацию?)

да

источник

18:01пожаловаться #5

AC

A C in Scrapy

Andrey Rahmatullin

да, DOWNLOAD_DELAY

да, Ты советуешь мне поднять его?

источник

18:02пожаловаться #6

AR

Andrey Rahmatullin in Scrapy

ничего не советую, что спросили то и ответил

источник

18:02пожаловаться #7

AR

Andrey Rahmatullin in Scrapy

с 403 это помочь не обязано

источник

18:03пожаловаться #8

AC

A C in Scrapy

Да?

источник

18:04пожаловаться #9

S

SoHard 🎄 in Scrapy

Andrey Rahmatullin

что такое CMD не знаю

Консоль

источник

18:04пожаловаться #10

AC

A C in Scrapy

Всем доброго вечера !
Методом проб и ошибок установил scrapy splash и вродебы всё работает , но не тут то было (((
ТАКОЙ ВОПРОС : spider переходит по ссылкам , но не по всем а только максимум 4 страницы . Как это можно исправить и в чем может быть причина ?
И как сделать так чтобы я мог тестировать response запросы через CMD но уже с поддержкой splash то есть чтобы подгружался весь код с JavaScript ?

Вы всегда можете использовать запрос внутри паука.

источник

18:06пожаловаться #11

К

Кирилл in Scrapy

Похоже пришло время ставить бота капчу

источник

22:13пожаловаться #12

B

Bulatbulat48 in Scrapy

может он хотел спросить как парсить твиттер?

источник

22:15пожаловаться #13

К

Кирилл in Scrapy

Я на этой неделе уже штуки 3 таких удалил

источник

22:17пожаловаться #14

2020 November 23

A

Andrii in Scrapy

Не могу подвязать splash к scrapyd(web) в докере

scrapyd_node_3:
    build: ./scrapyd_node_3
    environment:
      RESULT_DIR: "/app/results"
     SPLASH_SERVER: "splash:8050"
    ports:
      - "6802:6800"
    links:
      - splash
    volumes:
      - ./data:/var/lib/scrapyd
      - ./data/results:/app/results
    restart: unless-stopped

  splash:
    image: scrapinghub/splash
    ports:
      - "8050:8050"

источник

16:05пожаловаться #15

A

Andrii in Scrapy

settings:

SPLASH_URL = os.environ.get('SPLASH_SERVER', 'http://127.0.0.1:8050')

DOWNLOADER_MIDDLEWARES = {
    'scrapy_splash.SplashCookiesMiddleware': 723,
    'scrapy_splash.SplashMiddleware': 725,
    'scrapy.downloadermiddlewares.httpcompression.HttpCompressionMiddleware': 810,
}

источник

16:06пожаловаться #16

A

Andrii in Scrapy

кто подскажет что не так

источник

16:07пожаловаться #17

И

Илья in Scrapy

{"text": "\u201cA day without sunshine is like, you know, night.\u201d", "author": "Steve Martin"},
u201c Это же символ юникода какой-то? Насколько я помню надо где то кодировку сменить, чтобы таких символов не было.

источник

16:12пожаловаться #18

МС

Михаил Синегубов... in Scrapy

Илья

{"text": "\u201cA day without sunshine is like, you know, night.\u201d", "author": "Steve Martin"},
u201c Это же символ юникода какой-то? Насколько я помню надо где то кодировку сменить, чтобы таких символов не было.

json.loads

источник

16:16пожаловаться #19

AR

Andrey Rahmatullin in Scrapy

Илья

{"text": "\u201cA day without sunshine is like, you know, night.\u201d", "author": "Steve Martin"},
u201c Это же символ юникода какой-то? Насколько я помню надо где то кодировку сменить, чтобы таких символов не было.

не надо ничего нигде, так и должно быть

источник

16:48пожаловаться #20