Size: a a a

2020 May 02

МС

Михаил Синегубов... in Scrapy
Maxim Voloshko
А для регистрации на сайте, перехода на одну страницу и спарсивания нескольких статических элементов а таком случае, что лучше🤔
Если тебе пару страниц после авторизации надо пройти - нафиг тебе скрапи не нужен
источник

К

Кирилл in Scrapy
Михаил Синегубов
Если тебе пару страниц после авторизации надо пройти - нафиг тебе скрапи не нужен
не патриот ты)
источник

МС

Михаил Синегубов... in Scrapy
Кирилл
не патриот ты)
Я патриот, просто не извращенец😝
источник

MV

Maxim Voloshko in Scrapy
Михаил Синегубов
Если тебе пару страниц после авторизации надо пройти - нафиг тебе скрапи не нужен
Ну, на селениуме я застрял на том моменте, что не могу перейти на страницу по ссылке, в пределах сессии, но вроде там можно такое сделать🤔
источник

МС

Михаил Синегубов... in Scrapy
Maxim Voloshko
Ну, на селениуме я застрял на том моменте, что не могу перейти на страницу по ссылке, в пределах сессии, но вроде там можно такое сделать🤔
Ой, я хз, я силениум ни разу не запускал
источник

MV

Maxim Voloshko in Scrapy
Михаил Синегубов
Ой, я хз, я силениум ни разу не запускал
та у меня есть опасение, что оно на сервере не будет работать , не зря же это веб драйвер
источник

MV

Maxim Voloshko in Scrapy
А есть аналог скрапи только попроще 🌚 ?
источник

К

Кирилл in Scrapy
requests
источник

MV

Maxim Voloshko in Scrapy
Ах да)
источник

B

Bulatbulat48 in Scrapy
🎅 Austin Bluethy
Переслано от 🎅 Austin Bluethy
Кто-нибудь парсил инстагарм? Если да, то что лучше (splash или selenium) или python-instagram api ?
Там они раньше обычный Json отдавали, как сейчас не знаю
источник

AR

Andrey Rahmatullin in Scrapy
да, там был graphql
источник

🎅B

🎅 Austin Bluethy in Scrapy
Bulatbulat48
Там они раньше обычный Json отдавали, как сейчас не знаю
Я решил юзать splash. Тем более у меня линукс, а не 7 винда. И я могу себе позволить докер)
источник

B

Bulatbulat48 in Scrapy
🎅 Austin Bluethy
Я решил юзать splash. Тем более у меня линукс, а не 7 винда. И я могу себе позволить докер)
В Windows тоже есть докер, тут дело в скорости. Если данных не много почему бы и нет.
источник

🎅B

🎅 Austin Bluethy in Scrapy
Bulatbulat48
В Windows тоже есть докер, тут дело в скорости. Если данных не много почему бы и нет.
Я не смог поставить
источник

🎅B

🎅 Austin Bluethy in Scrapy
Там какая-то фигня была с виртуал боксом
источник

G

Georg in Scrapy
Добрый день, вопрос не по фреймворку, но тоже по парсингу, скорее по asyncio.
Пишу сервис для работы с апи, а точнее парсю некоторые данные, на aiohttp. Хочу разделить обработку новых данных и сам парсер, чтобы иметь возможность удобно чекать их корректность и актуальность перед отправкой в бд, а так же запускать по таймингу метод, не связанный с парсингом, но связанный с базой данных.
Мне не хватает навыков асинхронного программирования, чтобы придумать эффективный способ как это можно сделать.
Спасибо.
источник

B

Bulatbulat48 in Scrapy
Georg
Добрый день, вопрос не по фреймворку, но тоже по парсингу, скорее по asyncio.
Пишу сервис для работы с апи, а точнее парсю некоторые данные, на aiohttp. Хочу разделить обработку новых данных и сам парсер, чтобы иметь возможность удобно чекать их корректность и актуальность перед отправкой в бд, а так же запускать по таймингу метод, не связанный с парсингом, но связанный с базой данных.
Мне не хватает навыков асинхронного программирования, чтобы придумать эффективный способ как это можно сделать.
Спасибо.
Можно же просто парсить например в файл, а потом пост обрабатку делать
источник

G

Georg in Scrapy
Bulatbulat48
Можно же просто парсить например в файл, а потом пост обрабатку делать
Мне нужно чтоб все автоматизированно))
источник

К

Кирилл in Scrapy
Georg
Добрый день, вопрос не по фреймворку, но тоже по парсингу, скорее по asyncio.
Пишу сервис для работы с апи, а точнее парсю некоторые данные, на aiohttp. Хочу разделить обработку новых данных и сам парсер, чтобы иметь возможность удобно чекать их корректность и актуальность перед отправкой в бд, а так же запускать по таймингу метод, не связанный с парсингом, но связанный с базой данных.
Мне не хватает навыков асинхронного программирования, чтобы придумать эффективный способ как это можно сделать.
Спасибо.
так и в чем вопрос?)
источник

b

blessed in Scrapy
Почему никогда не вижу связку scrapy + asyncpg ?

Это плохая практика ?
источник