Телеграмм чат группы scrapy_python страница 1169

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Scrapy

408 membersпожаловаться на группу

2020 February 26

DO

Denis Olianiuk in Scrapy

Работу, вряд-ли, максимум большие заказы. Парсинг, это достаточно простое дело. Если будешь ml уметь, скорее всего, данные для тебя будут собирать другие люди с меньшим скилом

Ну простых сайтов да, а если уметь парсить сайты которые не хотят что бы их парсили тогда нет?

источник

18:27пожаловаться #1

МС

Михаил Синегубов in Scrapy

Рик Огурчик

Мне действительно интересно, что он хочет

ну, человек, в первую очередь, хочет получить ответ. Заодно определиться, можно ли расчитывать на фултайм работу в данном направлении

источник

18:28пожаловаться #2

МС

Михаил Синегубов in Scrapy

Denis Olianiuk

Ну простых сайтов да, а если уметь парсить сайты которые не хотят что бы их парсили тогда нет?

не, ну, теоретически - возможно. Практически - лично я не вижу смысла брать такого спеца (именно по scrapy) на фуллтайм. Слишком широкий круг задачь должен быть по парсингу.
но это мое мнение...

источник

18:30пожаловаться #3

R

вставлю 3 копейки...Парсинг не сложный процесс - но доставляет много гемороя и трудозатрат, потому компании сейчас начинают выводить парсинг на аутсорс. Проще нанять компанию которая будет парсить, проверять и складывать данные - и это стоит не дорого...70 сайтов распарсить с разной структурой стоило в районе 10K$ - и это контора из европы...Потому знать только парсинг - это маловато - ну или идти в компанию которая на этом специализируется

источник

19:14пожаловаться #4

AR

Andrey Rahmatullin in Scrapy

у нас если что открыта сейчас вакансия, https://apply.workable.com/scrapinghub/j/82B921A4F7/

Python Developer - Remote - Scrapinghub

We are looking for software engineers to join our Delivery team to work on web crawler development with Scrapy, our flagship open source project.Are you interested in building web crawlers harnessing the Scrapinghub platform, which powers crawls o...

источник

19:36пожаловаться #5

DO

Denis Olianiuk in Scrapy

вставлю 3 копейки...Парсинг не сложный процесс - но доставляет много гемороя и трудозатрат, потому компании сейчас начинают выводить парсинг на аутсорс. Проще нанять компанию которая будет парсить, проверять и складывать данные - и это стоит не дорого...70 сайтов распарсить с разной структурой стоило в районе 10K$ - и это контора из европы...Потому знать только парсинг - это маловато - ну или идти в компанию которая на этом специализируется

Это разовый платеж с гарантией что не будут капчи прилетать и без лимитов по запросам?

источник

19:53пожаловаться #6

R

Это за разработку спайдеров, саппор - отдельно оплачивается. Они ответсвенны за ежедневный апдейт данных и сохранение на S3. А что там они делают и как мониторят, это их дело.

источник

19:56пожаловаться #7

К

Кирилл in Scrapy

Если достаточно долго этим заниматься, на одних саппортах и будешь сидеть, постоянно что-то отваливаться будет

источник

19:58пожаловаться #8

DO

Denis Olianiuk in Scrapy

Ахаха

источник

19:58пожаловаться #9

R

Да да - саппорт спайдеров еще та боль

источник

19:58пожаловаться #10

М

Мак in Scrapy

саппорт же отдельно оплачивается, так что на эту нагрузку отдельных людей выделять можно. А если разработчику поддерживать всё, что он напишет - это вилы тогда...

источник

20:01пожаловаться #11

R

Да - вроде Индия помогает в этом....Не удивлюсь если и индусы писали спайдеры

источник

20:05пожаловаться #12

B

Bulatbulat48 in Scrapy

Не удивлюсь если Индия наняла русских/украинцев/.. так и живем 😀

источник

20:22пожаловаться #13

R

)))

источник

20:23пожаловаться #14

DO

Denis Olianiuk in Scrapy

Такой вопрос, кто знает, для селениума какие махинации стоит проделать, что бы он стал максимально похожим для сайта на обычный хром?

1. navigator.webdriver - убрать.
browser.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
"source": """
Object.defineProperty(navigator, 'webdriver', {
get: () => undefined
})
"""
})

2. В webdriver.exe заменить '$cdc_asdjflasutopfhvcZLmcfl_' на такую-же по длине строку но с другими символами.

3. Запускать с
options.add_experimental_option("excludeSwitches", ["enable-automation"])
options.add_experimental_option('useAutomationExtension', False)
options.add_argument('--disable-useAutomationExtension')

4. Что еще?

источник

21:04пожаловаться #15

Р

Рик Огурчик in Scrapy

Denis Olianiuk

Такой вопрос, кто знает, для селениума какие махинации стоит проделать, что бы он стал максимально похожим для сайта на обычный хром?

1. navigator.webdriver - убрать.
browser.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
"source": """
Object.defineProperty(navigator, 'webdriver', {
get: () => undefined
})
"""
})

2. В webdriver.exe заменить '$cdc_asdjflasutopfhvcZLmcfl_' на такую-же по длине строку но с другими символами.

3. Запускать с
options.add_experimental_option("excludeSwitches", ["enable-automation"])
options.add_experimental_option('useAutomationExtension', False)
options.add_argument('--disable-useAutomationExtension')

4. Что еще?

Выбрать драйвер хрома

источник

21:12пожаловаться #16

i

ildar in Scrapy

Vladyslav Babych

К примеру при запросе на

https://www.google.com/search?client=ubuntu&channel=fs&q=scrapy+shell+cut+links&ie=utf-8&oe=utf-8

запрос идёт на

https://www.google.com/search?client=ubuntu

кавычки ставь или url-percent encoding юзай

источник

22:39пожаловаться #17

i

ildar in Scrapy

а, уже ответили)

источник

22:39пожаловаться #18

2020 February 27

AO

Alexey Orloff in Scrapy

Всем привет, подскажите пожалуйста, какие таблицы базы данных должны быть для веб-сканера интернета, чтобы потом поисковую систему на ней сделать.

источник

07:23пожаловаться #19

МС

Михаил Синегубов in Scrapy

Всем привет, подскажите пожалуйста, какие таблицы базы данных должны быть для веб-сканера интернета, чтобы потом поисковую систему на ней сделать.

хм, там может сначала надо определишся, какие таблицы нужны для того, что бы сделать поисковую систему?
и да, не обижайся, но вопрос из раздела: как сделать кнопку "красиво"

источник

08:55пожаловаться #20