Size: a a a

2020 June 06

A

Al in secinfosec
Colmanno Sebastiani
паблишер
А что с ними?
источник

JR

Jack Red in secinfosec
Огромное вам @username_too_short спасибо!
источник

CS

Colmanno Sebastiani in secinfosec
говно на говне
источник

CS

Colmanno Sebastiani in secinfosec
Jack Red
Огромное вам @username_too_short спасибо!
погоди, это еще не все
источник

JR

Jack Red in secinfosec
Ok )
источник

CS

Colmanno Sebastiani in secinfosec
источник

CS

Colmanno Sebastiani in secinfosec
+ полазь там у него по блогу, там много разного интересного
источник

CS

Colmanno Sebastiani in secinfosec
вот тут можно практиковаться
http://toscrape.com/
источник

JR

Jack Red in secinfosec
Благодарю!
источник

CS

Colmanno Sebastiani in secinfosec
вот тут есть вк апи и немного кроулинга
https://www.coursera.org/learn/python-for-web
источник

CS

Colmanno Sebastiani in secinfosec
вот тут анализ и отрисовка
https://www.coursera.org/learn/python-for-data-science
источник

CS

Colmanno Sebastiani in secinfosec
в целом алогритм работы практически всегда одинаковый
- проводим разведку, смотрим есть ли ваф, трекалки, идем в роботс
- проверяем запросы в девтулзах, вполне возможно что ничего делать не надо т.к. оно или прямо жсоном передается, или есть незадокументированное апи
- проверяем на жс, если много всякого жс зависимого говна, то используем селениум. меньше жс говна или нет жс - скрэпи
- смотрим что тригерит капчу, делаем так чтобы капча не тригерилась. всегда если есть возможность не тригернуть капчу, то лучшее ее не тригерить, чем постоянно тыкаться в антигейты и ocr
- запасаемся региональными прокси, юа ротейтом, вычисляем делей
источник

JR

Jack Red in secinfosec
А на что задержка вычисляется?
источник

CS

Colmanno Sebastiani in secinfosec
на запросы
источник

CS

Colmanno Sebastiani in secinfosec
сколько запросов можно сделать до того как тебе кинут бот детекшн
источник

JR

Jack Red in secinfosec
Всё. Понял!
источник

CS

Colmanno Sebastiani in secinfosec
если не будешь использовать скрэпи, то тебе надо будет еще разбираться как это все распаралелить через торнадо, думать про делей, пагинацию и еще много чего
источник

JR

Jack Red in secinfosec
Буду
источник

CS

Colmanno Sebastiani in secinfosec
и захвати еще какой-то креш курс по регуляркам
источник

JR

Jack Red in secinfosec
Меня жестко поимели. Не хочу повторения. Задело...
источник