Size: a a a

2021 May 06

ΔΧ

Δαηιιλ о҉ Χαριμκ... in Scrapy
Спасибо за содействие :)
источник
2021 May 07

E

Evgen in Scrapy
Там в соседнем чатике сегодня вечером митап, на котором я планирую немного рассказать о том, что делать, если сайт не даёт собирать данные (антиботы и вот это всё)
https://t.me/parsing_conf/138
Telegram
Parsing Conf
#анонс

Parsing Conf

Митап про сбор данных

————————————
Дата: 7 мая (пятинца)
Время: 20-00 по Москве
————————————

@fobscraft. "Микрооптимизации парсинга в промышленных масштабах"
Парсинг нужно делить на разные итерации задач, а именно, краулинг, временное хранение данных (очереди, кафка), обработка данных, запись данных, прокси, контейнеры. Объясню, почему я считаю важным разделение каждой задачи на отдельные этапы и как это все между собой связывать, как подбирать инструменты и языки под исполнения каждой задачи.

@Verz1Lka. "Как добывать данные когда их не хотят отдавать"
1. Почему так происходит? Сервис хочет отдавать данные только реальным пользователям. Что нам делать? Пытаться выглядеть как реальный пользователь.
2. Уровни симуляции пользователя: заголовки, IP, Сессии, Javascript, Сложные отпечатки (js fingerprint, network fingerprint).
3. Заголовки: порядок важен, регистр важен. Пробелы важны.
4. IP. Адреса Тора, плохие прокси, дата центр прокси, всё это можно проверить.
5. Сессии
6. Javascript.…
источник

МС

Михаил Синегубов... in Scrapy
признавайся, кроме общих фраз - что то конкретное будет?
Правда, учитывая, что пол-часа - час, только "по верхам" и успеешь пробежаться. С тем планом и за день не управишься :))
источник

E

Evgen in Scrapy
Да я сам не знаю что получится.
источник

E

Evgen in Scrapy
источник

na

n00b always in Scrapy
Курсы в конце рекламировать будешь?)
источник

МС

Михаил Синегубов... in Scrapy
я попытался второй раз про скрапи видяху записать. Примитивнее некуда, так час вышел, причем, почти ничего не успел рассказать.... 😂
источник

E

Evgen in Scrapy
Да ну какие курсы
источник

DL

Dark Lord in Scrapy
А  будет запись?
источник

E

Evgen in Scrapy
Хз,вроде тока через недели 2
источник

DL

Dark Lord in Scrapy
А чего так долго то?
источник

E

Evgen in Scrapy
Не я организатор не ко мне вопросы
источник

SG

Safron Grinev in Scrapy
Ссылку кинь плз
источник

МС

Михаил Синегубов... in Scrapy
22 числа будет Data Fest у орга какие то заморочки с ними...
источник

МС

Михаил Синегубов... in Scrapy
могу только на первую версию, но там музыка орет 😂, я не знал что она запишется
источник

na

n00b always in Scrapy
Могу для чатика записать с экрана, если сие мероприятие не слишком поздно будет
источник

SG

Safron Grinev in Scrapy
Буду благодарен
источник

DL

Dark Lord in Scrapy
Поддерживаю.
источник

DL

Dark Lord in Scrapy
Буду признателен))
источник

DL

Dark Lord in Scrapy
Вроде в 20:00 по мск
источник