Size: a a a

2020 October 31

АМ

Антон Магурский... in Scrapy
щас дочитаю эту статью, может будет проще объяснить. просто выбор прокси плана подразумевает достаточное знание темы что выбрать. вот и пытаюсь разобраться с теорией
источник

B

Bulatbulat48 in Scrapy
Как вариант ещё https://www.scrapinghub.com/crawlera/
источник

AM

Adel Minkhaerov in Scrapy
Добрый вечер! Столкнулся со следующим кейсом:
Необходимо запарсить один сайт. На странице есть кнопки, которые раскрывают список услуг. В чем особенность этих кнопок:
1. При нажатии появляется информация, которую необходимо запарсить
2. При нажатии ссылка в браузерной строке не меняется. То есть, например, сайт example.com, после нажатии кнопки сайт остается таким же - example.com, а не example.com/extra_info.
3. Перед нажатием кнопки HTML один, после нажатия HTML другой - появляются необходимые элементы
Итак, вопрос: как сделать так, чтобы scrapy видел HTML после нажатия? Необходим селениум, или можно обойтись без него? Я новичок в scrapy и в скрапинге сайтов
источник

К

Кирилл in Scrapy
Adel Minkhaerov
Добрый вечер! Столкнулся со следующим кейсом:
Необходимо запарсить один сайт. На странице есть кнопки, которые раскрывают список услуг. В чем особенность этих кнопок:
1. При нажатии появляется информация, которую необходимо запарсить
2. При нажатии ссылка в браузерной строке не меняется. То есть, например, сайт example.com, после нажатии кнопки сайт остается таким же - example.com, а не example.com/extra_info.
3. Перед нажатием кнопки HTML один, после нажатия HTML другой - появляются необходимые элементы
Итак, вопрос: как сделать так, чтобы scrapy видел HTML после нажатия? Необходим селениум, или можно обойтись без него? Я новичок в scrapy и в скрапинге сайтов
Посмотри может быть эта информация есть в исходнике страницы, просто в другом месте, или же она подгружается xhr запросом, тогда тебе нужно без нажатий сразу запросить эту ссылку.
Тут написано, где искать этот запрос https://docs.scrapy.org/en/latest/topics/dynamic-content.html
источник

AM

Adel Minkhaerov in Scrapy
Кирилл
Посмотри может быть эта информация есть в исходнике страницы, просто в другом месте, или же она подгружается xhr запросом, тогда тебе нужно без нажатий сразу запросить эту ссылку.
Тут написано, где искать этот запрос https://docs.scrapy.org/en/latest/topics/dynamic-content.html
Понял. Буду изучать спасибо
источник

К

Кирилл in Scrapy
Adel Minkhaerov
Добрый вечер! Столкнулся со следующим кейсом:
Необходимо запарсить один сайт. На странице есть кнопки, которые раскрывают список услуг. В чем особенность этих кнопок:
1. При нажатии появляется информация, которую необходимо запарсить
2. При нажатии ссылка в браузерной строке не меняется. То есть, например, сайт example.com, после нажатии кнопки сайт остается таким же - example.com, а не example.com/extra_info.
3. Перед нажатием кнопки HTML один, после нажатия HTML другой - появляются необходимые элементы
Итак, вопрос: как сделать так, чтобы scrapy видел HTML после нажатия? Необходим селениум, или можно обойтись без него? Я новичок в scrapy и в скрапинге сайтов
90% что там не нужен селениум
источник

AM

Adel Minkhaerov in Scrapy
Кирилл
Посмотри может быть эта информация есть в исходнике страницы, просто в другом месте, или же она подгружается xhr запросом, тогда тебе нужно без нажатий сразу запросить эту ссылку.
Тут написано, где искать этот запрос https://docs.scrapy.org/en/latest/topics/dynamic-content.html
Исходник, вы имеете в виду html код?
источник

К

Кирилл in Scrapy
Adel Minkhaerov
Исходник, вы имеете в виду html код?
Или View Page Source (Ctrl+U  в хроме) или загрузи страницу отключив JS
источник

К

Кирилл in Scrapy
А там уже как обычно через поиск забивай какую инфу ищешь
источник

AM

Adel Minkhaerov in Scrapy
Кирилл
Или View Page Source (Ctrl+U  в хроме) или загрузи страницу отключив JS
Понял. Спасибо
источник
2020 November 01

SS

Stepan Smirnov in Scrapy
не подскажите как реализовать слудеющую логику:
CrawlSpider сначала отправляет два запроса, а потом проходит по ссылкам из start_urls с применением правил?
источник

ЛГ

Лев Гареев in Scrapy
Stepan Smirnov
не подскажите как реализовать слудеющую логику:
CrawlSpider сначала отправляет два запроса, а потом проходит по ссылкам из start_urls с применением правил?
пропиши запросы до спайдера
источник

ЛГ

Лев Гареев in Scrapy
не
источник

ЛГ

Лев Гареев in Scrapy
?
источник

ЛГ

Лев Гареев in Scrapy
передай нужное через self, я тупой, но вроде решение
источник

S

SoHard 🎄 in Scrapy
Может кто сталкивался или знает где найти. Нужно много "айтишных слов" чем больше тем лучше
источник

A

Andrii in Scrapy
SoHard 🎄
Может кто сталкивался или знает где найти. Нужно много "айтишных слов" чем больше тем лучше
источник

AC

Amber Claes in Scrapy
Можете подсказать чат по селениуму?
источник

S

SoHard 🎄 in Scrapy
Спасибо
источник

К

Кирилл in Scrapy
Вроде таких нет. Можешь поспрашивать в чатах QA
источник