Size: a a a

2018 June 11

B

Bulatbulat48 in Scrapy
Это Спайдер уже как бы настроенный
источник

B

Bulatbulat48 in Scrapy
Nazar
Тут мне не понятен момент, как по ссылкам ходить.
Можно ещё и parse_page обрабатыватт страницы
источник

B

Bulatbulat48 in Scrapy
И дополнительно вызывать scrapy request
источник

N

Nazar in Scrapy
Пойду погуглю. Пока плохо понимаю.
источник

EB

Elisei Badanin in Scrapy
Bulatbulat48
Lxml с xpath
в супе еще и формы итд есть, это надстройка над лхмл и прочими
источник

B

Bulatbulat48 in Scrapy
Elisei Badanin
в супе еще и формы итд есть, это надстройка над лхмл и прочими
она более вернего уровня?
источник

B

Bulatbulat48 in Scrapy
я думал паралельно что-то
источник

EB

Elisei Badanin in Scrapy
Nazar
Коллеги, есть небольшой вопрос.
Есть сайт с примерно такой структурой:

site.ru
site.ru/catalog/ - список разделов
site.ru/catalog/12345 (страница раздела)
site.ru/catalog/12345/?PAGEN_1=2 (пагинация)
site.ru/catalog/12345/12345 - товар.

Я написал спайдер, спарсил категории и понял(возможно ошибаюсь), что достучаться до товара можно  и без предварительного парсинга каталога с помощью
rules = (
       Rule(LinkExtractor(allow=('',)), callback='parse_page'),
   )
Но не могу понять как именно.

Пример того, что написал:
https://gist.github.com/wavedocs/ee02500a61234f50055a931d7329e66e
в стандартный парс передавать категории и отдельный для итемов, можно по хпазу выбирать
источник

EB

Elisei Badanin in Scrapy
Bulatbulat48
она более вернего уровня?
что-то вроде селениума по уровню(но без жс)
источник

B

Bulatbulat48 in Scrapy
#job #работа #python #вакансия #удаленно

Требуется Python Developer УДАЛЕННО!

✅Требования:
• Опыт в разработке от 3-х лет с использованием Python и Django
• Хорошее знание технологий парсинга сайтов - Scrapy, Splash, Headless Chrome
• Хорошие коммуникативные навыки
• Успешный опыт работы на проектах с распределенной командой

✅Условия:
• Основная задача – разработка и поддержка парсера сайтов по недвижимости
• Удаленная работа с почасовой оплатой, примерно 10-20 часов в неделю
• Оплата до 1200  руб/час

✉️ Если вас заинтересовала вакансия пришлите пожалуйста резюме на olga.pankina@hotger.com
источник

N

Nazar in Scrapy
Elisei Badanin
в стандартный парс передавать категории и отдельный для итемов, можно по хпазу выбирать
это легче\сложнее?
источник

N

Nazar in Scrapy
категории я уже спарсил, просто не знаю как дальше заставить скрапи работать
источник

EB

Elisei Badanin in Scrapy
гибче/легче
источник

EB

Elisei Badanin in Scrapy
ну по икспазу или паттерну выбирать страницы с айтимами и их на другой кэллбэк
источник

N

Nazar in Scrapy
Вот я тут получаю категории
def parse(self, response):
       root = Selector(response)

       links = root.css('li > a::attr(href)')

       for link in links:
           link_item = VodopadCatalogItem()
           link_item['link'] = link.extract()
           yield link_item
источник

N

Nazar in Scrapy
как теперь отправить его на другой коллбек?!
источник

B

Bulatbulat48 in Scrapy
yield scrapy.Request(url, callback=self.parse_httpbin)
источник

C

Cyberdine Engineering🐤 in Scrapy
Надо запустить какую нибудь рекламку этого канала
источник

C

Cyberdine Engineering🐤 in Scrapy
Комьюнити по скрепи просто нет. Надо это исправить
источник

C

Cyberdine Engineering🐤 in Scrapy
Я имею ввиду русскоязычного
источник