Size: a a a

2021 April 03

AR

Andrey Rahmatullin in Scrapy
сохраняй response.text, а не урлы.
источник

AR

Andrey Rahmatullin in Scrapy
ну и джс отключай
источник

J

Jonas in Scrapy
rink0
но парсинг это не про этику)))
Этично парсить наверное нереально)
Ну почему же? Страница сайта - это файл (-ы) на сервере, которые отдаются по запросу других компютеров. А уж какой программой я этот файл забираю, это моё дело. За молоком можно и на опеле поехать, и на велосипеде и вообще пешочком. А уж что с этим молоком я буду делать так вообще никого не должно интересовать. Может с печеньем съем, может манку сварю, может клей казеиновый буду делать или с котом поделюсь.
Странными выглядят как раз требования везти молоко только на тролейбусе, открывать бутылку читая молитвы и посматривая лёгкое порно и после каждого глотка сплёвывать непонятного рода примеси. :)
источник
2021 April 04

NZ

Nikita Zhidkov in Scrapy
Михаил Синегубов
@Krorel попробуй все же process_request и нам расскажеш 😂
в общем я просто сделал Middleware реквест в котором делается через селениум и всё продолжило работать с Rule и LinkExtractor
источник

BL

Boris Litvyakov in Scrapy
rink0
но парсинг это не про этику)))
Этично парсить наверное нереально)
в сша есть закон что если сайт доступен человеку то он должен быть доступен для роботов, по крайней мере мне так заказчик сказал
источник

EU

Egor Urvanov in Scrapy
Привет. Можно у Вас в канале разместить объявление?

В конце апреля планируется Parsing Conf 2. Темы докладов — самые разные. От сбора данных в интернете до методологий сбора данных "в полях".

Приглашаются все желающие. Неважно: есть у Вас опыт или нет.

Для того, чтобы понять, какие темы и направления Вы можете осветить на митапе, мы дадим несколько примеров тем докладов:
- Парсинг на C#
- Библиотека ferret
- Как скачать весь интернет
- Методология сбора данных с сейсмометров в Пакистане
- Разметка данных с помощью Yandex.Толока

Для того, чтобы участвовать, нужно предложить тему доклада до 9 апреля плюс тезисы.

Доклады по времени ограничиваются 30 минутами. Но также должны быть не короче 10 минут. Каждый доклад должен сопровождаться презентацией. Срок предоставления презентации до 19 апреля.

Контакты: @cuda23
Link channel: https://t.me/parsing_conf
источник

AV

Anatoli Valenda in Scrapy
Язык доклада и какой формат встречи (онлайн, как я понял)?
источник

EU

Egor Urvanov in Scrapy
Anatoli Valenda
Язык доклада и какой формат встречи (онлайн, как я понял)?
Онлайн. Русский.
источник

ГС

Георгий Сидоров... in Scrapy
Кто-нибудь парсил bitly.com? Ну то есть задача в том чтобы дать свою ссылку и забрать сгенерированную. Я в сурсах сайта нашел скрипт который это делает но он на json и я вообще не алë
источник

ГС

Георгий Сидоров... in Scrapy
Вроде выглядит структурно просто, но я все равно не знаю че с этим делать
источник

К

Кирилл in Scrapy
Георгий Сидоров
Кто-нибудь парсил bitly.com? Ну то есть задача в том чтобы дать свою ссылку и забрать сгенерированную. Я в сурсах сайта нашел скрипт который это делает но он на json и я вообще не алë
У них же есть api
источник

ГС

Георгий Сидоров... in Scrapy
Так ведь нужен для этого аккаунт
источник

ГС

Георгий Сидоров... in Scrapy
Бесплатный даёт 1000 линков в месяц
источник

ГС

Георгий Сидоров... in Scrapy
А нужно больше
источник

К

Кирилл in Scrapy
Георгий Сидоров
Так ведь нужен для этого аккаунт
Ну да)
источник

ГС

Георгий Сидоров... in Scrapy
Если просто парсить то неограниченно
источник

К

Кирилл in Scrapy
Ты не можешь достать данные из json?
источник

К

Кирилл in Scrapy
Георгий Сидоров
Если просто парсить то неограниченно
Я сомневаюсь что прям неограниченно. Они на этом деньги зарабатывают, так что скорее всего там будут какие-то проблемы с антиботами, или как минимум лимитом на ip
источник

ГС

Георгий Сидоров... in Scrapy
У меня прокси
источник

r

rink0 in Scrapy
Jonas
Ну почему же? Страница сайта - это файл (-ы) на сервере, которые отдаются по запросу других компютеров. А уж какой программой я этот файл забираю, это моё дело. За молоком можно и на опеле поехать, и на велосипеде и вообще пешочком. А уж что с этим молоком я буду делать так вообще никого не должно интересовать. Может с печеньем съем, может манку сварю, может клей казеиновый буду делать или с котом поделюсь.
Странными выглядят как раз требования везти молоко только на тролейбусе, открывать бутылку читая молитвы и посматривая лёгкое порно и после каждого глотка сплёвывать непонятного рода примеси. :)
Согласен)
источник